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内 容 人 简介 


本 书 分 为 3 篇 :基础 篇 (第 1 一 4 章 ) 以 隐 密 的 原理 为 中 心 ,主要 介绍 信息 隐藏 相关 背景 知识 及 数学 
模型 ;水 印 篇 (第 5 一 9 章 ) 围 绕 数字 认证 和 数字 追踪 ,主要 介绍 作者 在 数字 版 权 保 护 方 面 的 研究 成 果 以 
及 该 技术 未 来 的 发 展 趋势 ; 隐 密 通信 篇 (第 10 一 12 章 ) 主 要 介绍 在 网 络 环境 下 ,如 何 利用 信息 隐 密 技术 
解决 通信 内 容 的 信息 泄露 问题 。 另 外 ,本 书 对 近 些 年 发 展 很 快 的 PC 系统 以 及 移动 手机 App 应 用 系统 
的 个 人 隐私 保护 提出 了 新 的 隐 密 解决 方案 ,并 全 面 展示 了 新 的 研究 成 果 。 

全 书 内 容 丰 富 翔实 ,涉及 信息 论 .密码 学 .数字 图 像 处 理 . 音 /视频 压缩 编码 技术 .人 工 智 能 算法 等 ， 
覆盖 的 知识 领域 广 ,理论 与 实践 应 用 密切 结合 ,可 作为 信息 安全 网络 空间 安全 等 相关 专业 的 本 科 生 、 硕 
士 或 博士 研究 生 的 教材 ,也 是 值得 推荐 给 相关 领域 的 科研 和 技术 人 员 的 参考 读物 。 
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He 一 


21 世纪 是 信息 时 代 , 信 息 已 成 为 社会 发 展 的 重要 战略 资源 ,社会 的 信息 
化 已 成 为 当今 世界 发 展 的 潮流 和 核心 ,而 信息 安全 在 信息 社会 中 将 扮演 极为 
重要 的 角色 , 它 会 二 接 关 系 到 国家 安全 、 企 业经 营 和 人 们 的 日 种 生活 。 随 着 
信息 安全 产业 的 快速 发 展 , 全 球 对 信息 安全 人 才 的 需求 量 不 断 增 加 ,但 我 国 
目前 信息 安全 人 才 极 度 匮 乏 , 远 远 不 能 满足 金融 . 商业、 公安. 盏 事 和 政府 等 
部 门 的 需求 。 要 解决 供需 让 慎 ,必须 加 快 信息 安全 人 才 的 培养 ,以 满足 社会 
对 信息 安全 人 才 的 需求 。 为 此 ,教育 部 继 2001 年 批准 在 武汉 大 学 开设 信息 
安全 本 科 专 业 之 后 ,又 批准 了 多 所 高 等 院 校 设立 信息 安全 本 科 专 业 , 而 且 许 
多 高 校 和 科研 院 所 已 设立 了 信息 安全 方 癌 的 具有 硕士 和 博士 学 位 授予 权 的 
TRL o 

信息 安全 是 计算 机 .通信 、 物 理 ` 数 学 等 领域 的 交叉 学 科 , 对 于 这 一 新 兴 
学 科 的 培养 模式 和 读 程 设置 ,各 高 校 普 遍 缺 乏 经 验 , 因 此 中 国 计 算 机 学 会 孝 
育 专 业 委 员 会 和 清华 大 学 出 版 社 联合 主办 了 “信息 安全 专业 教育 教学 研讨 
会 ”等 一 系列 研讨 活动 ,并 成 立 了 “高 等 院 校 信息 安全 专业 系列 教材 ”编审 委员 
会 ,由 我 国信 息 安 全 领域 著名 专家 省 国 镇 教授 担任 编 委 会 主任 ,指导 “高 等 院 校 
信息 安全 专业 系列 教材 ?的 编写 工作 。 编 委 会 本 痢 人 研究 先行 的 指导 原则 ,认真 
人 研讨 国内 外 高 等 院 校 信息 安全 专业 的 教学 体系 和 课程 设置 ,进行 了 大 量具 有 前 
脆性 的 研究 工作 ,而 且 这 种 研究 工作 将 随 着 我 国信 息 安全 专业 的 发 展 不 断 深 
人 和 人。 系列 教材 的 作者 都 是 既 在 本 专业 领域 有 涂 厚 的 学 术 造 语 , 又 在 教学 第 一 线 
有 丰富 的 教学 经 验 的 学 者 ,专家 。 

该 系列 教材 是 我 国 第 一 套 专门 针对 信息 安全 专业 的 教材 ,其 特点 是 : 

J 体系 完整 结构 合理 ,内 容 先 进 。 

适应 面 广 : 能 够 满足 信息 安全 、 计 算 机 、 通 信 工 程 等 相关 专业 对 信息 

立体 配套 : 除 主 教材 外 ,还 配 有 多 媒体 电子 教案 ,习题 与 实验 指导 等 。 

版 本 更 新 及 时 , 紧 跟 科 学 技术 的 新 发 展 。 

在 全 力 做 好 本 版 教材 ,满足 学 生 用 书 的 基础 上 ,还 经 由 专家 的 推荐 和 审 
定 , 遵 选 了 一 批 国 外 信息 安全 领域 优秀 的 教材 加 入 系列 教材 中 ,以 进一步 满 
足 大 家 对 外 版 书 的 需求 。 “高 等 院 校 信 息 安 全 专业 系列 教材 "已 于 2006 年 年 
初 正 式 列 人 普通 高 等 教育 “十 一 五 ”国家 级 教材 规划 。 

2007 年 6 月 ,教育 部 高 等 学 校 信 息 安 全 类 专业 教学 指导 委员 会 成 立 大 会 


隐 黎 的 原理 及 应 用 


既 第 一 次 会 议 在 北京 胜利 召开 。 本 次 会 议 由 教育 部 高 等 学 校 信 息 安 全 类 专业 教学 指导 委 
AEAT AAE A AA, ENN 
等 学 校 信息 安全 类 专业 教学 指导 委员 会 的 成 立 对 我 国信 息 安全 专业 的 发 展 起 到 重要 的 指 
导 和 推动 作用 。2006 年 教育 部 给 武汉 大 学 下 达 了 “信息 安全 专业 指导 性 专业 规范 研制 ” 
的 教学 科研 项 目 。2007 年 起 该 项 目 由 教育 部 高 等 学 校 信息 安全 类 专业 教学 指导 委员 会 
组 织 实施 。 在 高 教 司 和 教 指 委 的 指导 下 ,项 目 组 团结 一 致 ,努力 工作 ,克服 困难 ,历时 5 
年 ,制定 出 我 国 第 一 个 信息 安全 专业 指导 性 专业 规范 ,于 2012 年 年 底 通 过 经 教育 部 高 等 
anid ti pi 
使 用 。2013 年 ,新 一 届 教 育 部 高 等 学 校 信息 安全 专业 教学 指导 委员 会 成 立 。 经 组 织 审查 
aiii onra ia a 
《高 等 学 校 信息 安全 专业 指导 性 专业 规范 》( 由 清华 大 学 出 版 社 正式 出 版 )。 

2015 年 6 月 ,国务院 学 位 委员 会 .教育 部 出 台 增设 “网 络 空间 安全 ”为 一 级 学 科 的 决 
E ,将 高 校 培 养 网 络 空间 安全 人 才 提 到 新 的 高 度 。2016 年 6 月, 中央 网 络 安全 和 信息 化 
领导 小 组 办 公 室 (下 文 简称 中 央 网 信 办 )、 国 家 发 展 和 改革 委员 会 .教育 部 、 科 学 技术 部 、 工 
业 和 信息 化 部 及 人 力 资 源 和 社会 保障 部 六 大 部 门 联合 发 布 ( 关 于 加 强 网 络 安全 学 科 建 设 
和 人 才 培 养 的 意见 》( 中 网 办 发 文 [2016]4 号 )。2019 年 6 月 ,教育 部 高 等 学 校 网 络 空 间 安 
全 专业 教学 指导 委员 会 召开 成 立 大 会 。 为 贯彻 落实 4 关于 加 强 网 络 安全 学 科 建 设 和 人 才 
培养 的 意见 》, 进 一 步 深化 高 等 教育 教学 改革 ,促进 网 络 安全 学 科 专 业 建 设 和 人 才 培 养 , 促 
进 网 络 空间 安全 相关 核心 课程 和 教材 建设 ,在 教育 部 高 等 学 校 网 络 空间 安全 专业 教学 指 
导 委 员 会 和 中 央 网 信 办 资助 的 网 络 空 en a 
安全 重点 规划 从 书 ” 的 工作 ,由 教育 部 高 等 学 校 网 络 空 间 安全 专业 教学 会 秘书 长 
封 化 民 教 授 担任 编 委 会 主任 。 esheets iaa 
工作 基础 和 成 果 、 阵 容 强 大 的 编审 委员 会 和 优秀 的 作者 队伍 ,目前 已 经 有 多 本 图 书 获得 教 
育 部 和 中 央 网 信 办 等 机 构 评 选 的 “普通 高 等 教育 本 科 国 家 级 规划 教材 ”普通 高 等 教育 精 
品 教材 “中 国 大 学 出 版 社 图 书 奖 "和 “国家 网 络 安 全 优秀 教材 奖 ” 等 多 个 奖项 ， 

“网 络 空 间 安全 重点 规划 从 书 ” 将 根据 《高 等 学 校 信息 安 全 专业 指导 性 专业 规范 》( 及 
后 续 版 本 ) 和 相关 教材 建设 课题 组 的 研究 成 果 不 断 更 新 和 扩展 ,进一步 体现 科学 性 、 系 统 
性 和 新 颖 性 ,及 时 反映 教学 改革 和 课程 建设 的 新 成 果 , 并 随 着 我 国 网 络 空间 安全 学 科 的 发 
展 不 断 完善 ,力争 为 我 国 网 络 空间 安全 相关 学 科 专 业 的 本 科 和 研究 生 教 材 建 设 .学 术 出 版 
与 人 才 培 养 做 出 更 大 的 贡献 。 

我 们 的 E-mail 地 址 是 : zhangm@tup. tsinghua. edu. cn ,联系 人 : KR. 
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在 互联 网 应 用 时 代 , 大 数据 和 云 计算 为 海量 数据 分 布 式 存储 .智能 搜索 
提供 了 便利 ,但 同样 也 为 用 户 的 隐私 带 来 潜在 的 安全 威胁 。 诸 如 用 户 的 重要 
数据 私密 以 及 敏感 信息 等 容易 被 搜集 、 转 存 , 而 且 一 旦 泄露 并 被 散布 是 很 难 
可 逆 追 踪 的 。 因 此 ,个 人 计算 机 、 手 机 以 及 各 种 电子 终 问 设备 中 用 户 隐 私 的 
保护 也 成 了 大 众 不 得 不 考虑 的 问题 。 

基于 互联 网 的 各 种 即时 通信 和 软件 存在 被 搭 线 甸 听 的 问题 ,致使 通信 的 内 
容 被 第 三 方 非 法 侦 听 。 犯 罪 分 子 利 用 盗 取 的 信息 进行 模仿 .诱导 、 实 施 网 络 
诈骗 ,使 公众 蒙受 巨大 的 财产 损失 。 有 人 甚至 惊 呼 ,在 数字 网 络 时 代 , 人 们 似 
平 部 住 在 了 “玻璃 房子 ”而 无 处 授 形 ! 信息 保密 问题 无 疑 成 了 公众 关注 的 热 
尽 之 一 。 

密码 学 (Cryptography) 是 传统 的 保密 方法 之 一 。 但 近 些 年 , 隐 写 术 
(Stegnography) 或 者 信息 隐藏 (Information Hiding) 技 术 的 兴起 ,为 保密 技 
术 市 来 了 另 一 种 全 新 的 思路 。 

本 书 之 所 以 命名 为 “ 隐 密 ”, 主 要 是 为 了 与 加密” 对 应 。 也 就 是 说 ,将 信 
息 隐 藏 和 密码 学 作为 一 个 层次 上 的 概念 ,将 隐 密 和 加 密 作 为 另 一 个 层次 上 的 
概念 比照 。 广 义 上 ,无 论 是 密码 学 中 的 加 密 (Encryption), 还 是 信息 隐藏 中 
的 隐 密 (Hiding) ,都 属于 保密 技术 的 范畴 。 

作为 一 种 有 特点 的 保密 技术 ,我 们 简单 地 用 5A 概括 隐 和 密 的 特征 。 时 效 
性 (Any-time): 时 间 上 不 能 确认 什么 时 候 发 生 。 随 机 性 (Any-where): 空间 
上 不 能 确认 发 生 在 哪里 。 其 骗 性 (Any-how): 手法 上 不 能 确认 以 什么 方式 
发 生 。 模 糊 性 (Any-what) : 感官 上 不 可 捉摸 。 和 谁 发 生 通 信 (Anyone): 对 
象 上 的 隐匿 性 。 类 似 地 ,可 以 把 这 些 A 扩展 到 无 穷 维 度 上 。 

如 今 的 隐 密 技术 已 经 逐渐 被 越 来 越 多 的 应 用 领域 所 关注 。 

。 政府 OA 系统 : 政府 办 公 重 要 文件 内 容 的 安全 保护 ,敏感 文件 的 保密 


传输 。 

。 情报 部 门 : 涉外 机 构 搜 索 的 敏感 情报 可 采取 隐 密 的 方式 进行 秘密 
传达 。 

。 公安 领 域 : 公安 部 门 的 行动 指令 等 可 采取 隐 密 的 传输 手段 ,避免 被 犯 
徘 分 子 反 侦 听 。 


。 军事 领域 : 军事 通信 部 门 需 要 将 行动 命令 以 及 ( 真 伪 ) 识 别 信息 隐藏 
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于 正 篆 的 通信 调度 内 容 中 。 


。 媒体 传播 领域 . 广电 媒体 可 利用 电视 节目 作为 载体 ,使 用 隐 密 传输 技术 传输 敏感 
或 重要 的 数据 内 容 。 

。 电子 商务 领域 : 电子 商务 系统 也 有 必要 采取 有 效 的 隐 密 技术 保护 用 户 个 人 的 数 
HE bak BA o 

。 企 事业 单位 文件 管理 系统 : 大 型 企业 内 部 隐私 数据 (竞标 书 等 ) 的 传输 也 同样 需 
要 掩蔽 保护 ，。 


相信 未 来 隐 和 密 技 术 的 发 展 还 会 有 更 广阔 的 应 用 空间 。 很 显然 , 随 着 网 络 通信 技术 及 
相关 技术 的 不 断 发 展 ,信息 保密 安全 面临 各 方 的 潜在 挑战 ,我 们 仍 需 要 不 断 研究 、 挖 据 新 
的 隐 密 应 用 技术 满足 公众 对 安全 保密 的 诉求 。 

本 书 主要 有 3 个 方面 的 特点 。 其 一 ,延续 性 : 作者 一 直 致 力 于 信息 隐藏 领域 的 研究 
工作 , 书 中 的 内 容 既 是 对 个 人 20 年 研究 成 果 的 总 结 , 也 是 信息 隐藏 这 门 学 科 这 人 么 多 年 发 
展 历程 的 一 个 侧面 体现 。 其 二 ,本 书 注重 理论 和 实际 相 结 合 : 基于 信息 论 和 统计 学 的 观 
点 ,对 国际 、 国 内 该 领域 已 有 的 研究 成 果 加 以 分 析 、 对 比 以 及 总 结 。 在 理论 的 指导 下 ,结合 
实际 ,给 出 实践 中 大 量 的 应 用 范例 。 其 三 ,侧面 体现 了 信息 隐藏 学 科 最 近 的 发 展 成 果 : 以 
前 该 领域 大 多 数 研 究 结 果 都 围绕 数字 认证 ,本 书 还 将 网 络 即 时 隐 密 通信 ,以 及 手机 移动 终 
端的 个 人 隐私 保护 作为 研究 内 容 加 以 重点 推广 ,具有 技术 上 的 超前 性 。 

编写 本 书 的 目的 是 向 读者 介绍 隐 密 的 基本 理论 和 应 用 方法 。 这 门 技术 融合 了 密码 
学 ,信息论 .网 络 通信 多 媒体 处 理 . 人 工 智能 ,心理 学 .感官 艺术 甚至 哲学 等 方面 的 发 展 成 
果 ,不 得 不 说 是 一 门 交 叉 性 比较 强 的 学 科 。 因 此 ,对 于 读者 ,要 深刻 理解 本 书 中 的 内 容 , 也 
许 需 要 别 的 一 些 书 籍 或 者 专业 知识 做 铺垫 。 

本 书 可 作为 信息 安全 网络 空间 安全 等 相关 专业 的 本 科 生 、 硕 士 或 博士 研究 生 的 

在 本 书 的 编写 过 程 中 ,博士 生 兰 磋 仔细 校对 并 整理 了 全 书 的 初稿 ,提出 了 不 少 宝贵 的 
修改 意见 ,她 对 书稿 付出 了 辛勤 劳动 并 做 出 很 大 贡献 ,在 此 向 她 表示 衷心 的 感谢 | 

本 书 得 到 国家 自然 科学 基金 项 目 ( 基 于 分 层 超 完备 字典 系数 表示 的 深度 学 习 算 法 研 
究 及 应 用 ,项 目 号 : 90308140034) ,陕西 省 重大 科技 攻关 项 目 ( 涉 密 信息 输入 输出 安全 防 
护 管理 系统 ) 的 资助 ,特此 致谢 。 
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基 础 篇 


基础 篇 以 隐 密 的 原理 为 中 心 , 主 要 介绍 信息 隐藏 相关 背景 知识 及 数学 模 
型 。 这 部 分 内 容 主 要 在 第 1 一 4 章 中 讲述 。 其 中 ,第 1 章 以 信息 论 为 基础 , 探 
讨 隐 密 的 理论 知识 ;第 2 章 以 编码 .密码 学 加 密 为 主 ,介绍 相关 的 保密 研究 模 
型 ;第 3 章 论述 在 水 印 认证 码 中 隐 密 的 相关 数学 知识 ;第 4 章 提 出 并 证 明 完 善 
的 信息 隐藏 方案 及 算法 。 


Sle | 
Hose Al Wt 


1.1 概率 与 随机 分 布 


EX: Riz XAY 是 随机 变量 ,用 p(x) 表示 X 取 值 为 x 的 概率 ,用 p(y) RAY 取 
值 为 y 的 概率 。 

联合 概率 : pry) Æ X 取 值 为 z 且 工 取 值 为 y 的 概率 。 

条 件 概 率 : p(x | y) 表示 给 定 Y 取 值 为 y 时 XX 取 值 x 的 概率 。 

联合 概率 和 条 件 概率 的 关系 : pay) = p(x | ypo). 

这 里 ,x 和 wy 可 互 换 , 即 p(x,y) = ply | Dpi). 

如 果 对 于 任意 zx EX,y CY. pley) = pla) ply) 都 成 立 , 则 称 X 和 YY 是 相互 独 
WAN. 

定理 1.1( 贝 叶 斯 定理 ): 如 果 p(x) > 0,p(y) > 0. 那么 


_ pply | x) _ PC) PC |y) = 
pl | y) = re a(x) (1-1) 


推论 1.1: WRX AY SME. 4AARSAMTHAN cA y, MA pa | y) = pla) 
或 者 p(y | x) = ply), 即 如 果 两 个 随机 变量 独立 ,那么 在 观察 任意 一 个 随机 变量 条 件 下 ， 
男 外 一 个 变量 的 概率 不 会 因此 改变 。 

定义 : 统计 偏差 。 

S P Fil Q 为 两 个 在 支撑 域 Q 上 的 离散 概率 分 布 , a EO, M 

d(P,Q) = >, | Pla) — QR) | (1-2) 
agn 

为 概率 分 布 P 和 Q 的 统计 偏差 。 

EX: 不 可 区 分 性 。 如 果 随 机 序列 (Pa) 和 (Q,} EBER Q 上 是 统计 上 不 可 区 分 
的 , 则 函数 d(P, ,Q,) 一 es， 其 中 6, 为 任意 小 的 正 数 。 也 可 称 序列 Pa) 和 (Q,} 是 统计 
上 可 忽略 的 。 


“1.2 A RR TET RAB 


定义 : 令 X 是 具有 字符 集 已 的 离散 随机 变量 ,其 概率 密度 函数 
Pla) = Pi{X—2z)}, x Ex 
Wi X WR A CX) 为 


隐 窖 的 原理 及 应 用 


H(X) 一 一 >) p(x) log: p(x) (1-3) 


zEX 
定义 : 用 五 表示 期 望 值 。 如 果 X ~ Pa), 则 随机 变量 g(X) 的 期 望 值 可 记 为 
Epg(X) = >) g(a) pla). (1-4) 


zex 


特别 地 , 当 g(x) = log: 时 , 则 


= 
pla) 
HX) = ehe ree (1-5) 
KAOS p(x) <1 意味 着 logs (1/p(x)) 三 0, 因 此 五 (CX) 三 0。 
(1) KS Joint Entropy) 
一 对 具有 联合 分 布 p(X,Y) 的 离散 随机 变量 X,Y WKS ME MW 
H(X,Y) =— >) >) p(a,y) log plz, y) (1-6) 
也 可 表示 为 
H(X,Y) =— Epo, log: p(X sY) (1-7) 
(2) 44 § (Conditional Entropy) 
如 果 X.Y ~ plx.y), WAM HCY | X) 可 定义 为 
HOY | D= J POOHY | X =a) 


xzEx 


= Ypa) Y pla | ylog: p(y | z) 


xzExX yeY 


— > Dplr,y)logsply | a) 


zrEX yeY 
=— Ex,» log, pCY | X) (1-8) 
(3) KSMMARAMN KA 
H(X,Y) = HCX) H HY | X) (1-9) 
等 效 地 ， 
logs p(X,Y) = log, p(X) + log, pcY | X) (1-10) 
H(X,Y |Z) = H(X |Z2)+HV(Y | X,Z) a a 
(4) #8 XT (Relative Entropy) 
两 个 概率 密度 函数 Cae) 和 g(x) ZAI AY AAT RE ML 


、 Fain Poa 
D(p || q) > p(x)log, m 


(1-12) 
(5) H BC Mutual Information) 
WR X~ plz). Y~ pU) 且 X 和 YY 具有 联合 概率 分 布 X,Y ~ pla.y). MEXX 
AY 的 互信 息 TX5Y) 为 


3 
地 
me 
as 
ey 
x 


= D(p.y) || p(x) ply)? 


p(x ,Y) 


p(X) p(y) (1-13) 


— 已 we log, 


推论 : 联合 炉 和 互信 息 之 间 的 关系 为 
I(X;Y) = H(X)— H(X | Y) (1-14) 
也 就 是 说 ,互信 息 I(X;Y) 是 X 的 不 定性 因为 Y 的 背景 知识 而 下 降 。 


“1.3 W RFA TET A A YE N 


定理 (Hi BE) S PEHLA Be 入 1 „Äg sr" DE 符合 概率 play, 9a ia TN 分 布 , 于 是 
CO (1-15) 
i=l 


定义 : (ARAM) EAE Z 的 条 件 下 ,随机 变量 X 和 Y ARETE LA 
I(X;Y | Z)= H(X | Z) — H(X |Y,2) 
a p(X,Y | Z) a 
POG sXe eX) = TOY | Kea Xe aes) (1-17) 
i=] 


定义 : KARAT HA DC p(y | x) | | gy | c)) AA Re EE PRR p(y | x) Fl gly | x) 
在 概率 密度 函数 p(x) 上 的 相对 入 的 平均 。 
Diply |x) || ay | x)) = p(x) dey | x)log ne | z (1-18) 
定理 : CHH XTA KS BE ALM) 
D(p(asy) || gx,y)) = Dp) || q(x)) + DplYy | x) || diy | x)) (1-19) 


44 ey AY) Be HE SE 


定理 : 令 pla), a), x CX, 为 两 个 概率 密度 函数 ,于 是 
Dip lilo =o (1-20) 
当 且 仅 当 对 所 有 z.p) = q(x) 都 成 立 。 
推论 : 〈 互 信息 的 非 负 性 ) 对 于 任意 两 个 随机 变量 X.Y, 都 有 
I(X;Y) >0 (1-21) 
“AWM X 和 工 相 互 独立 时 ,该 式 中 等 号 的 情况 成 立 。 
推论 : DO ply lo llagay |z) 三 0。 
当 且 仅 当 ,对 于 所 有 具有 pla) > OK vy Mr BA PCy | a) = 二 gly | 工 )。 
推论 : I(X;Y 12) 三 0, 4AM4 FRE 民 的 条 件 下 ,> 和 工 相 互 独立 时 等 号 成 立 。 
定理 : H(X) Clog | X |。 这里, 为 定义 范围 | X| 中 的 数 , 当 且 仅 当 X 在 定义 域 
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X 上 均匀 分 布 时 等 号 成 立 。 
定理 : (RRR HX |Y) < H(X) , 当 且 仅 当 X 和 了 相互 独立 时 等 号 成 立 。 
定理 : ( 箭 的 独立 界 ) 令 随机 变量 Xı sX? eas ee 符合 概率 pla, LE 9%" ce 4} AB 
Te: 
H(X, ;人 SHX») (1-22) 


当 且 仅 当 所 有 X: 相互 独立 时 等 号 成 立 。 
随机 过 程 { X;, WARENA 
HOO = ln THX, D A (1-23) 


i oD 


SES A M RR RA ZED 。 
15 BRAKE 


定义 : 离散 随机 过 程 Aisa 被 称 为 马尔 可 夫 (Markov) 链 或 者 马尔 可 夫 过 程 ,对 
T Eam e S. VAR x, LE "TT 9 Cn 9 Let EX, 都 有 
P(A bat | X., = 2.5 | Ai i oe, — xı) 


<P Au | (1-24) 
在 这 种 情况 下 ,随机 变量 的 联合 概率 密度 函数 可 写 为 
play 92 stn) plr) plr: | | FIE | Xo) pla, | eS (1-25) 


定义 : Markov 链 被 称 为 是 非 时 变 的 ,如 果 条 件 概率 pCa | zx,) 不 依赖 于 n, 也 就 
Fn = 1,2,… 以 及 所 有 a,b CX, 都 有 
P,(Xn =b | X, =a} = P(X, =b| X =a)? (1-26) 
(1) 如 果 {X;} 是 一 Markov 链 , 则 X, 被 称 为 在 时 间 n 时 的 状态 。 一 个 非 时 变 的 
Markov 链 可 以 用 它 的 初始 状态 和 概率 转移 矩阵 P = 二 LP; Jij E{1,2,…,m}) 描述 。 这 
E, m 表示 可 能 的 状态 数 , Pi = P, {Xm =J | Xn 二 i}. 
(2) 如 果 随 机 变量 的 概率 密度 函数 在 时 间 n 的 概率 为 pC), 则 概率 密度 函数 在 时 
间 7 十 1 可 表示 为 
P(t) = dP (xn) Paa (1-27) 


(3) WX — Y > Z 形成 一 Markov $£, Wl 
IKX;Y) > I(X;Z) UR KX;Y | Z) KX;Y) (1-28) 


| Jensen 不 等 式 


如 果 f 是 一 止 函数 , X 是 一 随机 变量 , 则 
E(f(X)) 之 fCE(X)) (1-29) 
进一步 ,如 果 f 是 严格 目的 ,上 面 不 等 式 中 等 号 成 立意 味 着 X 是 一 常量 。 
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1 7 Fano 不 等 式 


假设 要 估计 一 个 具有 p(x) 分 布 的 随机 变量 X。 观察 一 个 通过 条 件 概 率 p(y | z) 和 
X 联合 分 布 的 随机 变量 Y, E X= g(Y) 为 通过 Y 对 X 的 估计 。 若 想 约束 错误 六 交叉 的 
概率 ,定义 错误 概率 P, = P, X£ X), 则 


H(P.) + P,log.(| X |—1) > H(X | Y) (1-30) 
Fano 不 等 式 可 以 弱化 为 
1 + P.log: | X |> H(X | Y) (1-31) 
或 者 
H(X | Y)—1 a ees 
Po S Aone 
log. |X) eee 


注意 : P. = 0 意味 着 H(X |Y) =—0, 即 直觉 猜想 没有 任何 错误 。 


= 1.8 Chernoff # 


& XXX 为 n FS Xe le] oP AH KÁ 3 Fl (Bernoulli) 变量 ,具有 相同 的 期 望 值 
Pa FH MER O<e<l, 


A > e |< emer >p (1-33) 

) 一 

r | 二 > x: < e |< ewer exp (1-34) 
i 二 1 


z | ae x Pi o Ag 亲 BA ) | 

这 里 , D(x,y) = zlog: (> )+a x)logs (T= ) 是 一 个 止 的 在 0 二 zy 二 1 域 上 
JEH HY PRA. M4 x Al y 相等 时 等 号 成 立 。 

注意 : 以 后 如 不 特别 声明 ,所 有 的 log 函数 都 以 2 为 底 。 


”机 一 般 的 通信 系统 


一 般 的 通信 系统 框图 如 图 2-1 所 示 。 


信息 源 一 | 转换 一 消息 g fai ae Bhi e 转换 Led 信 宿 | 


图 2-1 一 般 的 通信 系统 框图 


发 送 端 : 发 送 方 或 者 编码 器 将 从 信息 源 来 的 信号 转换 成 消息 编码 序列 ,而 且 利用 当 
地 产生 的 载波 信号 将 消息 调制 (如 果 是 基带 信号 传输 , 则 不 存在 调制 和 解 调 ) 转 换 成 能 够 
传输 的 数字 信和 号 ,然后 发 送 到 信道 。 

接收 端 : 接收 方 或 者 解码 器 将 收 到 的 调制 数字 信号 进行 解 调 重新 生成 原 数字 消息 数 
据 , 最 后 将 消息 数据 解码 还 原 成 源 信息 。 

信道 ; 作为 在 发 送 端 和 接收 端 信号 的 传输 通道 ,可 以 是 无 线 的 ,也 可 以 是 有 线 的 , 信 
道 的 物理 组 成 称 为 媒介 ,如 无 线 的 空气 ,有 线 的 同 轴 电 缆 、 双 绞 线 等 ,在 网 络 环境 下 可 以 理 
解 为 收发 应 用 之 间 的 链 路 ， 


5 一般 通信 系统 的 主要 元 素 及 指标 


Eee 


2.2.1 数据 元 素 与 信号 元 素 


数据 元 素 (Data Element): 数据 元 素 是 表示 一 块 信息 的 最 小 实体 。 在 数据 通信 中 ， 
人 们 的 目标 是 发 送 数据 元 素 。 

信号 元 素 (Signal Element): 信号 单元 是 数字 信号 的 最 小 单元 。 在 数字 通信 中 ,信号 
元 素 承 载 数据 单元 。 

Ka: 数据 元 素 是 人 们 要 发 送 的 ,而 信号 元 素 是 人 们 能 发 送 的 。 数 据 元 素 被 承载 , 信 
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222 ”数据 速率 与 信号 速率 


数据 速率 (Date Rate): 一 秒 发 送 的 信号 元 素 ( 位 ) 的 数量 ,单位 是 (b/s), 有 了 时 也 称 为 
比特 率 (Bit Rate) 。 
信号 速率 (Signal Rate): 一 秒 发 送 的 信号 元 素 的 数量 ,单位 是 (baud) ,有 时 也 称 为 脉 
冲 速 率 (Pulse Rate) .调制 速率 (Modulation Rate) 或 波 特 率 (Baud Rate), 
数据 率 和 信号 速率 之 间 的 关系 : 在 数据 通信 中 ,最 坏 的 情形 是 需要 最 大 数据 率 , 最 好 
的 情形 是 需要 最 小 信号 速率 。 一 般 情 形 下 ,数据 率 和 信号 速率 之 间 的 关系 如 下 : 
S=cXxNX = baud (2-1) 


这 里 的 N 是 数据 速率 (b/s),c 是 情形 因子 , S 是 信号 元 素数 量 ,而 ~ 表示 每 个 信号 元 
素 能 承载 的 数据 元 素 的 比值 。 
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最 小 市 宽 : 


B... = cX NX + 


UR a hE a a o W BT DA 4 BI) 1 AY ER 
最 大 数据 速率 : 


Nox 一 二 XBXr 


信道 容量 (Shannon 容量 定理 ): 
C = Blog: (1 +>) 
Shannon 容量 定理 能 够 确定 噪声 信道 理论 上 的 最 高 数据 速率 。 这 里 ，C 代表 信道 容 
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2.3.1 Simmons" 狱 至 ”问题 及 保密 通信 系统 


Alice 和 Bob 两 个 人 深 陷 ;他们 只 能 利用 正常 信件 的 交流 进行 秘密 通信 ,Alice 
和 Bob 的 信件 内 容 看 起 来 正常 ,但 其 中 隐 含 了 “越狱 2 的 信息 MAE Oscar 具有 审查 他 们 
通信 内 容 的 权利 ,而 且 拥 有 足够 的 资源 进行 “盘问 ”和 质疑 。 

基于 Simmons 狱 鞭 问题 的 一 个 典型 的 保密 通信 系统 (Secrecy System) 模 型 ”如 
图 2-2 所 示 。 

可 以 用 一 个 五 元 组 全 二 (M,C,K,E,D) 表 示 一 个 保密 系统 , 厂 主 要 包括 以 下 5 个 
部 分 。 

。 明文 空间 M: 是 明文 的 有 限 集 , m = (mm em, ), HHA m EM,n 表示 长 度 。 

。 密 文 空间 C: 是 密 文 的 有 限 集 , c = {cicca}, 其 中 c EC, 


BARBRA A 


Alice Bob 


隐 写 变换 


图 2-2 保密 通信 系统 模型 


À 密 钥 知识 K: 是 密 钥 的 有 限 集 ， k = {kikk} 5 其 中 REK, 
。 MEKA E: 给 定 明 文 消息 m CM, BAR CK, 将 明文 m 变换 为 密 文 c<， 即 


c= Elm,k), m EM,k EK (2-2) 
。 解密 函数 D: 接收 者 利用 通过 密 钥 信道 送 来 密 钥 进行 变换 得 到 明文 , 即 

m= D(c,k), m EM, k EK (2-3) 
这 里 要 注意 ,每 个 加 密 变 换 都 对 应 一 个 解密 变换 ,也 就 是 说 必须 满足 : 

Dx (Ex(m)) =m, V71 EM (2-4) 


2.3.2 ” 私 钥 和 公 钥 加 密 体制 


在 2.3.1 节 提 到 的 保密 系统 模型 中 , 隐 写 变换 和 隐 写 提取 这 两 个 模块 涉及 的 密 钥 分 
配方 法 有 两 种 类 型 : 一 种 是 私 钥 ( 单 钥 ) 密 码 体制 ;一 种 是 公 钥 ( 双 钥 ) 密 码 体制 。 


1. 私 钥 ( 单 钥 ) 密码 体制 

加 密 密 钥 和 人 解密 密 钥 相同 ,也 就 是 加 密使 用 的 密 钥 和 解密 使 用 的 是 同一 个 密 钥 。 按 
照 密 钥 的 唯一 性 ,解密 者 如 果 要 获得 明文 ,就 必须 拥有 正确 而 且 唯 一 的 加 密 者 的 私 钥 , 如 
图 2-3 所 示 。 


图 2-3 WAME RR 


单 钥 密 码 体制 不 仅 可 用 于 数据 加 密 ,也 可 用 于 消息 认证 ,可 分 为 流 密 码 和 分 组 密码 两 
大 类 。 但 在 现代 网 络 通信 系统 中 ,这 种 单 钥 体制 有 如 下 缺点 。 
。 发 送 者 用 目 己 的 私 钥 加 密 明 文 获 得 密 文 发 送 到 接收 者 。 为 了 使 接收 者 获得 秘密 
消息 ,同时 也 需要 将 私 钥 发 送 给 接收 者 ,他 的 私 钥 同 时 被 暴露 。 
。 为 了 保护 隐私 不 被 攻击 ,发送 者 只 能 采用 一 次 一 密 的 方式 ,这 样 在 随机 意义 上 是 
安全 的 ,但 发 送 者 必须 每 加 密 一 次 ,就 产生 新 的 密 钥 。 那 么 ,在 这 种 加 密 模 式 下 ， 
密 钥 的 生成 、 转 储 、 保 存 就 成 了 负担 。 
。 私 钥 需 要 为 外 更 安全 的 信道 进行 传输 。 
10 
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2. AE ie h 

典型 的 公 钥 密码 体制 有 RSA 公 钥 加 密 系 统 , 如 图 2-4 所 示 。 它 由 国际 上 著名 的 三 位 
学 者 R. L. Revest, A. Shamir 和 L. Adleman 发 现 ,并 已 普及 应 用 。RSA 加 密 的 本 质 在 于 
当 数 据 位 极 大 时 ,在 不 知 陷 门 信息 下 , 极 难 确 定 变 ( 代 ) 换 之 间 的 关系 。RSA 不 仅 可 用 于 
加 蜜 , 也 可 用 于 数字 签名 。 


明文 


图 2-4 公 钥 加 密 系 统 


© 公 钥 体制 下 ,加密 密 钥 和 解密 密 钥 不 同 。 

© 公 钥 体制 使 用 的 密 钥 对 (ki ,k; ) 理 论 上 由 第 三 者 产生 并 提供 给 通信 的 双方 。 也 就 
是 说 ,加 密使 用 的 密 钥 和 解密 使 用 的 密 钥 基于 随机 序列 的 产生 和 数学 上 的 难题 。 
可 以 做 到 加 密使 用 的 密 钥 和 人 解密 使 用 的 密 钥 不 同 ,但 显然 这 一 对 密 钥 (ki sko) Z 
间 有 某 种 内 在 复杂 的 对 应 关系 。 

。 采用 公 钥 密码 模式 ,允许 发 送 方 和 接收 方 在 通信 时 临时 产生 会 话 密 码 。 发 送 方 不 
需要 发 送 目 己 的 私 钥 & 到 接收 方 ,接收 方 用 目 己 的 私 钥 解密 即 可 。 这 样 ,通信 双 
方 都 防止 了 私 钥 的 泄露 。 

。 在 一 对 密 钥 中 , 公 和 钥 k, 可 以 是 公开 的 用 户 信 息 , 如 公开 电话 号 码 等 。 

显然 ,与 私 钥 体制 相 比 , 公 钥 体制 采用 两 个 密 钥 将 加 密 和 解密 分 开 进 行 ,因此 它 具 有 

如 下 3 个 优点 。 

。 通信 双方 无 须 事 移交 换 密 钥 ,就 可 进行 保密 通信 。 

。 以 密 钥 对 里 面包 含 的 公 钥 作为 加 密 密 钥 , 私 钥 作为 解密 密 钥 ,可 实现 多 个 用 户 加 
密 的 消息 只 能 由 一 个 用 户 解密 ,可 用 于 网 络 保 密 通信 。 

。 将 用 户 私 钥 作 为 加 密 密 钥 ,而 以 公 和 钥 作 为 解密 密 钥 , 则 可 实现 一 个 用 户 加 密 的 消 
息 由 多 个 用 户 解 密 , 可 用 于 数字 群 签名 。 


2.3.3 ”加 密 及 解密 过 程 


假定 整个 明文 空间 M 有 一 个 概率 分 布 , 用 pm (7x) 表示 明文 x 发 生 的 先 验 概率 , 密 钥 被 
选择 的 概率 表示 为 prk), 用 pc(y) 表 示 导 出 密 文 y 的 后 验 概率 。 对 每 个 kk EK, 定义 


C(k) = {E, (a2): x EM) (2-5) 
BUR k EA COA AEF] BE A ECE RET y CC, 加 密 后 的 密 文 分 布 概率 为 
bO) = >) prb) pm(Dx Cy) (2-6) 


Fi — Fi a ABET y EC 和 x EM, 在 一 定 的 输入 下 观察 系统 的 输出 ,计算 条 件 概率 
pc | x )( 即 给 定 工 是 明文 , y 是 密 文 的 概率 ) 为 
11 


im RBA A 


beyl = >) px) (2-7) 


(k: z= D,(K)} 
利用 贝 叶 斯 定理 ,在 观察 系统 输出 下 计算 条 件 概率 pu (a | y)〈 即 给 定 密 文 Mr 是 
明文 的 概率 ) 为 


tk: yECCE)} 


注意 : 式 (2-7) 和 式 (2-8) 可 用 于 密码 分 析 和 攻击 。 
234 ”计算 保密 性 与 完全 保密 性 


计算 保密 性 : 当 攻 破 一 个 密码 体制 已 知 最 好 的 方法 需要 的 计算 时 间 过 大 时 (限定 一 
个 超常 规 时 限 ), 则 称 一 个 密码 体制 是 “计算 上 保密 的 ”。 另 一 个 提供 计算 保密 性 的 方法 是 
把 一 个 密码 体制 的 保密 性 转换 为 一 些 已 经 研究 过 的 非常 困难 的 问题 。 

无 条 件 保 密 性 : 如 果 一 个 密码 体制 在 有 无 限 计 算 资 源 条 件 下 都 不 能 被 破译 , 则 将 之 

密码 体制 的 无 条 件 保密 性 显然 不 能 根据 计算 复杂 性 人 研究 ,因为 我 们 允许 计算 时 间 是 
无 限 的 。 人 研究 无 条 件 保密 性 的 最 合适 的 方法 是 概率 论 。 

保密 性 : 由 Shannon 提出 ,是 一 个 | K|=|Cl=| MI 的 密码 体制 ,该 密码 体制 提供 
完全 保密 性 , 当 且 仅 当 每 个 密 钥 是 等 概 1/ |K| 使 用 的 , 且 对 每 个 x EM Aly EC, 都 有 唯 
一 的 密 钥 有 满足 Dk (zx) = y。 有 关 此 定理 的 证 明 可 参考 文献 [2j]。 

EX: 一 个 密码 体制 具有 人 完全 保密 性 ,如 果 pul | y) = pu (x) 对 所 有 x EM,y EC 
成 立 , 即 在 给 定 观 察 到 的 密 文 y 的 条 件 下 ,明文 r 的 后 验 概率 等 于 明文 xz 的 先 验 概率 。 

注意 : 完全 保密 性 的 一 个 典型 实现 是 一 次 一 密 乱 码 本 。 
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定理 : © pM) 为 明文 消息 M 的 先 验 概 率 ,p(E|M) 为 选择 明文 M 的 条 件 概 率 ， 
P(E) 为 获得 的 密 文 的 概率 ,p(E|MD) 为 EF 被 截获 后 明文 消息 M 的 后 验 概 率 。 对 于 一 个 完 
善 安全 的 充分 必要 条 件 是 : 对 每 一 M 和 EE,p(E|M) 王 P(E) 都 成 立 。 

相反 ,如果 p(E|MD)==p(E), 则 可 得 pCM | E) = 二 pOMWM)。, 以 上 定理 可 通过 贝 叶 斯 定理 

也 就 是 说 ,对 于 一 个 完善 保密 系统 ,选择 明文 消息 M 下 的 密 文 与 明文 消息 M 是 相互 
独立 的 , 即 消 息 的 先 验 概率 等 于 后 验 概率 。 在 这 种 条 件 下 ,保密 系统 对 于 计算 是 免疫 的 。 

注意 : 完善 的 保密 系统 意味 着 能 够 获得 完善 的 安全 。 


24 BEDERAK 


Dea | E PRI 


信息 隐藏 是 指 将 一 种 重要 信息 隐藏 在 男 一 种 信息 中 。 隧 密 通 信和 是 信息 隐藏 的 一 种 ， 
它 建立 在 正常 通信 系统 的 基础 上 。 其 含义 是 在 正常 通信 的 内 容 中 ,将 重要 的 秘密 信息 ( 密 
12 
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信 ) 隐 着 在 其 中 ,从 而 达到 密 信 的 潜行 传送 而 不 为 人 类 的 感官 系统 所 觉察 。 

通常 ,一 个 正常 的 通信 系统 分 为 发 送 者 、 信 道 和 接收 者 。 对 应 地 ,一 个 隐 密 系统 可 分 
为 隐 和 密 者 ( 端 ) ,信道 和 解密 者 ( 端 )。 关 于 这 里 的 信道 定义 ,一些 文献 把 多 媒体 的 内 容 作 为 
隐 密 的 隐藏 信道 (Covert Channel) ,而 从 一 般 通 信 的 角度 讲 , 也 可 认为 是 一 种 特殊 的 公共 
通信 信道 。 为 一 些 文献 也 把 它们 称 为 编码 大 、 品 声 信道 (攻击 者 ) 以 及 解码 大 , 见 狱 莅 


241 信息 隐藏 的 通用 模型 
信息 隐藏 的 通用 模型 如 图 2-5 所 示 。 


公共 信道 


图 2-5 信息 隐藏 的 通用 模型 


其 中 ,对 秘密 信息 的 加 密 操作 属于 可 选 环 节 。 硅 进行 隐秘 , 则 对 应 于 接收 方 需要 进行 
相应 的 解密 操作 。 数 据 处 理 操作 是 通信 双方 都 必须 执行 的 环节 ,也 是 能 够 进行 隐 密 通信 
和 解密 的 关键 。 

秘密 信息 M (Secret Message): 将 要 加 入 载体 中 的 消息 数据 。 秘 密 数 据 在 真正 隐藏 
到 载体 之 前 ,可 以 通过 加 密 变 换 的 方式 转换 为 类 似 于 噪声 的 伪 随 机 序列 。 为 了 增加 系统 
的 安全 性 ,在 这 个 阶段 一 般 会 对 M 加 密 , 然 后 得 到 M , 进而 进行 后 续 操 作 。 

原始 载体 C (Cover): 即 进行 隐藏 的 载体 ,如 图 像 、 音 频 、 视 频 和 文本 等 。 为 了 达到 掩 
饰 的 效果 ,一般 情况 下 ,秘密 信息 需要 般 入 在 载体 的 特征 分 布 区 域 。 因 此 ,在 实施 真正 的 
信息 租 入 前 还 需要 对 载体 的 特征 进行 分 析 处 理 。 

im ARIE E (Embedding Algorithm): 用 户 通 过 使 用 密 钥 利用 该 算法 将 秘密 信息 骸 
和 人 到 载体 中 。 

载体 特征 S (Stego-Text): S 是 基于 C 的 特征 数据 , S EC. 

提取 算法 D (Extracting Algorithm); 用 户 通过 分 享 的 密 钥 利用 该 算法 将 秘密 信息 
从 携 载 密 信 的 载体 中 提取 出 M。 


242 ”攻击 信道 模型 


攻击 信道 : 攻击 者 (Oscar) 可 允许 从 无 记忆 信道 中 选择 任意 一 个 信道 攻击 水 印 , 而 且 
无 论 是 编码 硕 , 还 是 解码 硕 , 事 先 都 不 能 确认 攻击 采取 的 是 哪个 信道 。 隐 密 背 景 下 的 攻击 
信道 如 图 2-6 Pra. 


隐 窖 的 原理 及 应 用 


图 2-6 隐 密 背景 下 的 攻击 信道 


24.3 隐 密 通信 模型 
基于 流程 图 2-5, 可 给 出 隐 密 通信 模型 的 一 个 形式 化 定义 ,具体 如 下 。 
定义 : 令 》(C,M,K,S,D,E) 六 元 组 表示 信息 隐藏 系统 。C 表示 原始 载体 ,M 表示 


要 传输 的 信息 , K 表示 隐藏 系统 的 密 钥 集合 , S 是 指 实际 通信 中 发 送 的 隐秘 载 体 ,E 和 DD 
分 别 表 示 通 人 算法 和 提取 算法 , 则 


E(M,K)= >, ~Pms(M=m,K =k) 
mEM,kEK 
= 之 / 力 (5) (2-9) 
seS 
解密 过 程 : 
DS I= > pi =sK=—® 
= dj pm) (2-10) 
meM 
中 间 信 道 过 程 : 
sp (3 二 2,P(S = s) (2-11) 


注意 ,这 里 之 所 以 把 S 和 5 区 别 对 待 ,是 因为 在 发 送 者 和 接收 者 之 间 存 在 一 MAS 
传输 。 信 号 经 过 信道 可 能 会 存在 有 限 的 干扰 损失 。 在 信息 隐藏 的 背景 下 ,也 把 中 间 的 这 
个 信道 等 效 成 攻击 信道 ,参见 狱 革 模型 。 当 然 , 后 面 还 会 对 这 个 攻击 信道 加 以 约束 。 


25 互联 网 络 下 的 通信 保密 体系 结构 


一 直 以 来 ,有 关 互 联网 安全 的 技术 多 指 密 码 学 ,使 用 密码 学 可 以 将 在 互联 网 络 中 传输 
的 报 文 变 成 安全 的 .能够 抵抗 一 定 攻击 的 技术 ,能 够 解决 互联 网 中 的 信息 安全 问题 ,如 保 
蜜 性 完整 性 .鉴别 性 和 不 可 否认 人 性 。 

但 随 春 科 技 的 进一步 发 展 , 传 统 数据 报 文保 密 的 手段 已 经 无 法 完全 保障 互联 网 中 传 
输 信 息 的 安全 性 ,于 是 越 来 越 多 的 学 者 设法 引 和 人 信 息 隐 藏 技术 进一步 保障 数据 的 安全 性 。 


2.5.1 网 络 即 时 通信 系统 的 体系 结构 


图 2-7 为 一 般 情 况 下 的 一 个 即时 通信 体系 架构 。 
即时 通信 系统 涉及 许多 方面 ,如 服务 此 架构 、 数 据 库 搭建 .软件 通信 协议 .数据 控制 以 
及 存储 等 ,而 建立 在 不 同 开 发 平台 上 的 即时 通信 和 软件 可 能 会 采用 不 同 的 体系 架构 。 
14 
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HP P 


图 2-7 即时 通信 体系 架构 


2.5.2 即时 通信 系统 的 传输 模式 


即时 通信 技术 是 一 种 基于 互联 网 的 通信 技术 ,涉及 的 领域 非常 广泛 ,主要 包括 IP, 
TCP、UDP、RMTP 等 网 络 协议 ,以 及 P2P 技术 .多 媒体 编 解 码 技术 等 。 根 据 应 用 背景 的 
不 同 , 即 时 通信 技术 可 使 用 多 种 通信 模式 。 

C/S 模式 : WBA He MIRA a SEA PUD. Pg FE 5 AR SF it EVIE BE 
才能 进行 通信 。 在 C/S 架构 模式 下 ,由 于 客户 端 数量 众多 并 且 每 个 客户 端 都 是 并 发 访 
问 ,因此 服务 硕 采 用 分 层 结构 进行 并 发 控制 。 

P2P 模式 : 男 一 种 即时 通信 模式。 与 C/S 模式 不 同 ,P2P 模式 属于 对 等 通信 模式 ,不 
存在 中 心 结 点 。 每 个 客户 端 都 是 对 等 的 通信 实体 ,在 使 用 服务 的 同时 也 在 提供 服务 。 
P2P 通信 模式 下 通常 存在 一 个 服务 器 用 于 协助 客户 端 之 间 建 立 P2P 连接 ,连接 建立 成 功 
后 ,通信 双方 客户 端 之 间 就 可 以 脱离 服务 器 使 用 P2P 信道 进行 通信 了 。 

混合 模式 : 在 即时 通信 系统 中 ,一 般 采 用 C/S 和 P2P 相 结 合 的 通信 模式 ,如 图 2-8 所 
示 。C/S 模式 为 用 户 提 供 了 号 份 认 证 、 客 户 机 状态 管理 等 功能 。P2P 模式 人 负责 为 用 户 拓 
供 客户 机 之 间 的 通信 功能 ,两 种 模式 相互 结合 ,以 提高 系统 性 能 和 通信 效率 。 


服务 组 


TCP/UDP TCP/UDP 


P2P 信 道 


客户 机 A | 客户 机 B 


UDP 
图 2-8 即时 通信 模型 图 


隐 窖 的 原理 及 应 用 


2.5.3 网 络 终端 的 保密 应 用 系统 


在 应 用 层 , 开 发 终端 的 保密 应 用 系统 主要 是 为 网 络 客 户 端 提 供 一 个 安全 的 服务 介入 。 
除 正 痕 的 即时 通信 功能 外 ,用 户 还 可 以 借用 应 用 系统 提供 的 诸如 加 密 以 及 隐 密 等 技术 对 
敏感 的 数据 内 容 进行 在 线 或 下 线 的 保护 。 
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水 印 认 十 码 


将 水 印 看 作 一 种 通信 系统 加 以 研究 ,从 信息 论 的 角度 对 水 印 的 通 人 容量 .失真 以 及 噪 
声 信道 下 认证 码 的 概念 等 进行 分 析 。 在 该 研究 方向 上 ,国内 外 比较 突出 的 学 者 主要 有 P. 
Moulin,J. A. O’sullivan, R. Ahlswede.G. Dueck 和 丛 守 等 人 人。 本章 主要 对 上 述 学 者 的 
研究 成 果 进 行 了 分 析 和 总 结 。 从 信息 论 的 角度 研究 水 印 问题 所 建立 的 研究 模型 以 及 方法 
思路 也 是 后 续 应 用 的 理论 基础 。 


31 相 天 定义 


定理 3.1 令 V 表示 一 个 有 限 的 字符 集 , v 是 取 值 在 集合 V 中 的 随机 变量 。 于 是 可 
假定 掩饰 载体 由 一 无 记忆 具有 变量 V 属性 的 信 源 {V” | 站 产生 。 密 信 m 则 独立 于 载体 
从 一 个 有 限 集 合 (1,2,…,M} 中 均匀 地 选取 。 编 码 者 可 根据 信 源 输出 的 原始 载体 u” 和 密 
Am, 编码 输出 一 个 与 载体 序列 长 度 相同 的 序列 z" (一 "Cu" ,m)) GER: 这 里 假设 信 源 
输出 的 消息 序列 的 长 度 和 经 编码 后 的 码 长 度 相同 , 同 为 n) 。 

定理 3.2 为 了 测定 中 间 过 程 ( 水 印信 道 ) 的 失真 , 引 和 人 一 个 累计 类 型 的 失真 测度 o, 
因此 ,对 于 任意 两 个 序列 变量 到 = (t stn v8 tt, ) EV”, X = Cr, 5X2 yz) CX", 都 有 

plu" 2") = — D pn (3-1) 


rey st (3-1) AT DLE HY s a) 为 平均 失真 率 .， 

定理 3.3 攻击 者 使 用 单一 的 离散 无 记忆 信道 W 攻击 水 印 序列 x", 攻击 信道 的 输入 
为 与 ,输出 为 罗 。 为 了 便于 记述 方便 ,期 间 假 设 他 们 分 别 从 有 限 的 字符 集合 X 和 Y 中 
而 来 。 

注意 ,对 于 攻击 信道 的 输出 也 必须 加 以 失真 约束 。 不 失 一 般 性 ,假定 单一 无 记忆 攻击 
信道 目 动 满足 失真 约束 条 件 。 

定理 3.4 为 了 安全 ,约定 在 发 送 端 的 编码 器 通常 通过 一 个 编码 映射 置 乱 掩 饰 文本 ， 
而 在 接收 端的 解码 硕 需 要 一 个 逆 上 映射 的 过 程 恢 复 密 信 。 

定理 3.5 WAM (Side Information) 和 认证 Key: 4 F Æ N Sa 0 Aa 2 ARS 5 OD F 
BY 2 HI (Key-Resources) 的 考虑 ,将 水 印 认 证 人 码 同 具有 边 信 息 的 水 印 认 证 码 C(WIDCSI) , 
以 及 具有 安全 Key 的 水 印 认证 码 C(WIDCK) 在 概念 上 加 以 区 分 。 

定理 3.6 WIDCSI: 在 参考 文献 [2j 中 WIDCSI 被 称 为 一 个 “在 发 送 者 和 接收 者 之 间 
具有 边 信 息 的 水 印 认 证 编码 ”。 


隐 窖 的 原理 及 应 用 


假设 在 时 间 上 ， 编 码 郁 能 够 根据 掩饰 文本 的 现时 输出 二 ,三 2 以 及 以 给 定 的 条 件 概 率 
Piy | w) 产生 “ 某 个 Key 的 成 分 ”。 这 就 是 说 ,如 果 源 输出 一 个 掩饰 文本 wu” 的 序列 , 编 
码 器 则 以 概率 Piv | u) 输出 产生 一 个 联合 概率 条 件 下 的 序列 L = (CL, LL) = 
la 二 《li1,l2"…,l,), MA BIKA HE IK Bll Be Wie AY AR SS. Ja AW A A fa Bs fa E 
三 =" \ De 703 ATA BPR EZ HK ED . 

这 种 情况 下 ,依赖 于 Key 的 信 源 事实 上 是 由 条 件 分 布 Puv 决定 或 者 等 效 于 联合 分 布 
概率 Pv。 因此 ,这 可 理解 为 在 编码 器 和 解码 器 两 边 是 纯粹 的 边 信 息 ,而 不 是 “安全 的 
Key”。 那 就 是 说 ,如 果 (V|) 是 具有 一 般 V 属性 的 一 个 无 记忆 的 掩饰 文本 ,而 且 
{L”|%1) 为 能 被 编码 右 和 解码 右 随 时 观察 到 的 边 信 息 , 于 是 {(v",L”)} 就 是 具有 一 般 
[LV,Lj 属 性 的 相关 无 记忆 源 。 因 此 ,解码 絮 能 够 从 边 信息 中 学 习 到 有 关 掩 饰 文本 的 某 些 
特征 信息 ,而 对 于 攻击 者 什么 也 不 知道 。 这 种 假设 的 根本 原因 是 : 作为 通信 双方 ,Alice 
和 Bob 始终 拥有 比 Oscar 多 得 多 的 背景 知识 1 

于 是 ,一 个 (RA, ,hz ,D1) WIDCSI 就 是 一 个 对 于 m = {1,2,…,M}), 满足 以 下 条 
件 {Qu Dn Ci"): O EL",m EM} 的 系统 。 

Qn: 混沌 映射 矩阵 。 

对 于 所 有 m 二 1,2,°+,M,Q,: V" X L" > X", 都 有 

y Pa Gut sl") YW Ot [wo 2") <D, (3-2) 
u” ev" i” EL” a" Ex" 

XE, Pu 表示 一 般 的 (V,L) 的 联合 分 布 。 

Dn: 与 Q, FAR H E K9 BR EE 

对 于 所 有 的 请 EL EM, Dn: Da Cl") CY", 都 有 

Po > QD 1 (3-3) 
u” EV” , I7 EL” x” Ex” 
A, 表示 第 一 类 型 错误 。 
而 且 对 于 所 有 mr,m CM,m~m', 


» Py, Cu" lL") > Qua Cr OW (De) |2") <A (3-4) 
ev" el” x” ex" 
这 里 ， A2 表示 第 二 类 型 错误 。 
码 率 的 定义 为 
R = loglog | M | (3-5) 


定理 3.7 WIDCK: (it 3a 04 AF fe 1 REE TELE OCA = u” 的 输出 ,以 任意 
方式 产生 一 个 Key: K, = K, u"), 而 且 将 之 通过 一 个 安全 (无 噪声 ) 信 道 发 送 到 解码 器 。 
因此 ,攻击 者 绝对 不 知道 载体 (除了 分 布 ) ,也 不 知道 Key。 因 为 对 于 掩饰 文本 z 的 一 个 
给 定 输 出 ,编码 郝 也 许 会 随机 产生 一 个 天 ,由 此 可 认为 WIDCSI 码 是 一 种 特殊 的 
WIDCK 编码 ,通常 情况 下 后 者 更 加 有 效 。 

注意 ,掩饰 文本 输出 确定 的 Key 是 由 一 特殊 的 Key 函数 确定 的 。 当 然 ,Key 的 大 小 
必须 加 以 限制 ,我们 要 求 它 随 痢 编码 长 度 的 增加 而 按 指数 规律 增加 ,而且 在 人 码 率 上 受 限 于 
Key X Rx. “4 Re KF MHA AI HV). 编码 器 自然 能 够 通知 解码 器 掩饰 文本 的 输 
出 。 但 是 ,Key 的 “剩余 部 分 ?也 许 会 看 成 是 增加 认证 容量 的 通信 者 之 间 的 随机 性 

18 


第 3 章 水 印 认 证 码 


JER”, 
于 是 ,一 个 (n,R,Rx hi Di) WIDCK 码 为 : 对 于 所 有 M = (1,2,…,M), 满足 以 
下 条 件 {Qn ,Da kid Wr: m €M,k, EK,} 的 系统 。 
Quom 二 1,2,…,M 是 从 V" X K, — X” 的 混沌 映射 矩阵 (攻击 信道 输入 的 字符 )， 
> Pi) >) We Chale") >) Qi Car" lu" ,ks) Cu" 2") < D, (3-6) 
sEV" ha EK, x” EX" 


对 于 所 有 k, €CK,.m EM, Dn (kn) C y", 第 一 类 型 错误 。 
ST Pu") X) We Chala") SS Qi Clu" kW" (Dn R12" > 1—A (3-7) 
ka CK, 


uw EV zx" Ex” 


对 于 所 有 的 m, m EM, m Æm ,第 二 类 型 错误 。 
ST Pru) DN We Cha lu) X) Qi Ca" lu" kW" (Dy Cka) la") > A (3-8) 


wey" ka EK, FEX” 
码 率 的 定义 见 式 (3-5) 。 
K, 是 一 有 限 域 上 的 集合 ,将 被 称 为 密 钥 书 , 而 且 
~log|K,|< Rx (3-9) 


Rx 称 为 Key 率 。 

Wk 是 一 个 混沌 映射 矩阵 Wk : V” 一 K,。 当 掩饰 文本 VV 被 随机 输入 到 信道 Wx, 
中 ,其 输出 的 随机 变量 将 被 记 为 天 ,。 也 就 是 说 ,随机 变量 对 〈《 ,天 ,) 具有 联合 概率 分 布 : 
Pyrgr Cu" sk") = Py(u We CR, | u") u” EV.k, EK, . 

特殊 地 ,， 天” 也许 是 掩饰 文本 输出 的 确定 的 图 数 , 而且 在 Pyre Cu”, k") = 
Pu We Ck, | u”) 的 情况 下 ,我们 将 K SREE V 上 的 函数 (注意 , 天 "的 选取 不 依 
Hi FIA Em EM, 因为 Key 将 不 依赖 于 所 保护 的 消息 ) 。 

定理 3.8 信道 容量 : 两 种 类 型 的 编码 容量 分 别 记 为 Cwwsi((V,L),W,D1) 以 及 
Cwwk (VW), Rk: Di), V.L) 和 上 分 别 是 通常 意义 下 的 无 记忆 相关 源 以 及 源 ; W 是 一 
无 记忆 攻击 信道 ; Pk 是 Key 率 , 而 Ai 是 失真 判 据 。 


_ ee 


分 人 圣 一 定 公 用 信 源 的 两 者 (或 多 者 ) 之 间 的 随机 性 ,也 许 是 相关 的 信 源 ,或 者 是 特 指 
(有 了 噪声 或 无 噪声 ) 的 一 些 信 道 。 这 些 两 者 之 间 的 随机 性 仅仅 是 公共 域 上 的 两 个 随机 变 
量 , 相 互 之 间 在 概率 上 是 收 钱 的 。 可 以 根据 信 源 的 情况 建立 不 同 的 模型 。 

处 于 建立 水 印 认 证 码 的 目的 ,我 们 需要 随机 性 的 两 种 类 型 。 下 面 ,相关 源 
(CVD 对 应 于 掩饰 文本 以 及 边 信 息 , 而 无 记忆 信道 驳 对 应 于 在 水 印 认证 中 的 攻击 
信道 。 模 型 下 中 的 天 ,对 应 于 WIDCK 的 模型 。 


3.2.1 模型 1 : 具有 两 个 源 的 约束 噪声 信道 


D ((V, Ly) ) 22) 是 分 别 具 有 两 个 分 量 AL 的 相关 无 记忆 源 , 字 符 集 OAL 类 属 
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(V ,L)。 假设 有 两 个 人 ,如 发 送 者 和 接收 者 。 发 送 者 可 能 能 观测 到 整个 源 V, La) 的 整 
个 输出 ,而 接收 者 只 能 观测 到 分 量 工 ,。 

基于 以 上 考虑 ,发 送 者 为 了 建立 公共 随机 性 ,在 一 定 的 约束 条 件 下 ,可 以 通过 无 记忆 
信道 W 问 接 收 者 发 送 消 息 , 而 接收 者 则 规定 不 允许 回 发 送 者 发 送 任何 消息 。W 信道 的 输 
入 取 自 字符 集 X, 输出 则 属于 字符 集 Y。 

发 送 者 首先 从 码 字 集合 u Cx" 中 选择 一 个 具有 长 度 为 n 的 源 输 出 序列 作为 信道 码 
字 , 同 时 产生 一 个 随机 变量 M,M 代表 他 /她 在 一 有 限 集合 M 上 均匀 取 值 的 “私有 的 随机 
数 ”, 而 且 与 源 输出 〈V,, 工 ,) 相互 独立 。 

假设 给 定 一 个 在 式 (3-1) 中 定义 的 失真 测度 op 和 一 个 失真 判 据 Di 。 根据 源 输出 
(Vasl) 二 (uo) 以 及 私有 的 随机 数 M = m, 发 送 者 选择 一 编码 字 az, Cu", 1") Eu(C 
x"), 使 编码 字 和 相关 源 V” = w" 的 分 量 之 间 的 失真 也 不 会 超出 Di。 也 就 是 说 ， 

r DP und > > Paa a aD, (3-10) 


u eV"? EL” 
如 果 发 送 者 给 信道 输入 码 字 In (u" 1"), 接收 者 则 以 概率 W”(y” | x Cu" ,2")) 收 到 一 
个 序列 y" CY". 我 们 还 可 以 选择 x,, Cul) 为 随机 输入 序列 而 替代 一 个 确定 的 序列 (这 在 
证 明 上 是 方便 的 ) 。 
最 后 ,对 于 一 个 有 限 集合 A, 其 长 度 典 型 地 随 着 源 输 出 长 度 n 的 增加 而 指数 增加 。 
也 就 是 说 ,存在 一 个 常数 &， 
“log | A|<k, (3-11) 


发 送 者 依据 信 源 的 输出 CV". L") ALM ,通过 一 个 函数 创建 一 个 在 支撑 域 A 上 的 随机 
映射 变量 F, 
F: V'XL'XM>A (3-12) 
而 接收 者 根据 信道 W 的 输出 和 信 源 分 量 L” eH ,通过 一 个 函数 创建 一 个 随机 逆 
映射 变量 G, 
G: XY (3-13) 
根据 文献 L3j 中 的 术语 ,我 们 称 由 上 述 方法 得 出 的 随机 变量 对 (fF,G) 是 可 达 的 ,并 且 
称 (F,G) 是 一 种 4 -类 型 的 公用 随机 对 。 如 果 
Pr{íFÆG}<1 (3-14) 
典型 地 , 当 源 序列 长 度 n 是 够 大 时 ,4 可 以 是 一 任意 小 的 正 实数 。 如 果 式 (3-14) 中 的 
A 任意 小 ,不 难看 出 在 式 (3-11) 和 式 (3-14) 条 件 下 ,由 Fano A$ sk A BA ~H(F) 和 


IHG) 可 以 任意 接近 ,这 一 点 从 文献 [3] 也 能 看 出 。 因 此 ,我 们 选择 LHF) 和 
1 


SHG) 的 其 中 之 一 作为 随机 数 的 炉 率 ，。 


EX: 如 果 对 于 任意 正 实 数 和 足够 大 的 (依赖 于 s、 Aly), 都 存在 一 个 4 -型 的 公 
共 随 机 数 满 足 式 (3-10) 一 式 (3-14) 。 并 有 目 
Cs) max [1CU;L.Y) + HCL | U)]4+ Rx 


= WEW(V.L,.U,X,Y9€Qx * ((V, L), W, Rg: D}) 
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我 们 称 一 数 对 (r, Di ) 为 公共 随机 可 达 的 ,于 是 有 
THF) > (3-15) 
以 及 
2P o} 一 元 到 (3-16) 


最 后 一 个 条 件 式 (3-16) 要 求 公 共 随 机 概率 必须 是 近似 平均 分 布 ,并且 称 为 近似 均匀 
条 件 , 这 样 要 求 是 为 了 减少 认证 码 的 第 二 类 错误 。 可 达 数 对 的 集合 称 为 公共 随机 概率 的 
容量 范围 。 对 于 固定 的 Di , 一 般 随 机 概率 的 容量 定义 为 

Cals L) Ws Di) = maxir:(r, D,) } (3-17) 

TER ESR AP TR RRA TA BELA A I BR itl]. RELA 
为 实际 信道 的 容量 是 有 限 的 。 

这 个 模型 和 文献 L3] 中 的 模型 有 三 点 不 同 。 

第 一 ,在 文献 L3j 的 模型 I 中 ,发 送 者 和 接收 者 之 间 的 信道 速率 是 小 于 或 等 于 R 的 无 
品 信 道 ,而 当前 模型 一 般 是 有 了 噪声 的 。 

第 二 ,本 模型 对 信 源 失真 度 的 要 求 不 仅 扮 演 边 信息 的 角色 ,还 扮演 限制 者 的 角色 。 也 
就 是 说 ,为 了 减少 失真 ,发 送 者 必须 选择 适当 的 码 字 ,这 使 得 变换 更 加 困难 。 为 了 说 明 这 
一 点 ,考虑 一 个 极端 的 状况 : 信 源 的 边 信息 是 一 个 常量 ,在 模型 I 中, 信 源 完全 没有 影响 ， 
因此 一 般 随 机 容量 等 于 信道 容量 。 而 在 本 模型 中 信道 起 作用 ,因为 发 送 者 可 能 不 会 自由 
地 选择 码 字 ,因此 减少 了 一 般 随 机 性 ,获得 本 模型 的 容量 范围 也 是 绝对 非 平凡 的 。 

第 三 ,在 本 模型 中 ,发 送 者 和 接收 者 分 别 观 察 序列 VL = Cu" 0") AIL = 1", E 
te He > Bil, — ALBA DL ES A HCL”) = VLL) (两 个 观测 者 之 间 的 互信 息 )。 因 
此 ,并 不 奇怪 定理 Cr((V,L),W, D) = max [LICU;L,Y) + HCL |DD)] 和 


(VLU, X,Y) €QUV,L),W,D) 


文献 [3] 中 的 定理 不 同 KER fE PT A OG E R A OS A E 
获得 。 

322 HL: 双 源 的 这 约束 噪声 信道 和 无 噪声 信道 

很 明显 ,研究 模型 I 的 目的 是 为 了 构建 带 边 信 息 的 水 印 认证 码 WIDCSI。 接 下 来 ,为 
了 研究 带 密 钥 的 水 印 认 证 码 WIDCK, 引 入 一 般 随 机 性 的 模型 [ 。 实 际 上 ,我 们 增加 了 所 
谓 的 “ 边 信 息 ”, 导 致 建立 的 模型 比 实际 需要 的 模型 更 具有 一 般 性 。 于 是 ,为 了 定义 模型 
[ ,只 要 在 模型 工 的 基础 上 再 增加 一 条 无 噪声 信道 ,而 为 此 几乎 不 需要 增加 额外 的 工作 。 

也 就 是 说 ,我 们 假定 相关 信 源 为 {(V",L*)}2，、 有 了 品 信 道 攀 、 失 真 约束 式 (3-10) 和 发 
送 者 的 个 人 随机 M 依然 有 效 。 另 外 ,发 送 者 从 消息 集合 K, 中 选择 一 条 消息 &。 以 速率 
Llog | K |< Ri 通过 一 无 品 信 道 发 送 给 接收 者 。 当 然 , & 必须 是 信 源 输出 和 发 送 者 个 人 
随机 数 ( 水 印 ) 的 函数 , 即 
看 作 输 入 为 um) 的 攻击 信道 COW | K) 的 输出 。 为 了 定义 此 模型 的 一 般 随机 性 ,将 式 
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(3-13) 修 改 为 
| (3-18) 
同时 保持 式 (3-10) 一 式 (3-16) 不 变 。 
类 似 地 ,也 可 以 定义 Ccren《((V,L),W ,Rx ,Di)、 相 关 无 记忆 信 源 (V, 工 )、 无 记忆 信道 
W., Key 率 P; 以 及 失真 测度 Di。 


3.2.3 MHI: 复合 信道 


假设 攻击 者 从 一 禾 满 足 攻击 失真 标准 的 信道 中 选择 一 条 平稳 无 记忆 的 信道 攻击 水 
印 ,而 编码 者 和 人 解码 者 都 不 知道 攻击 者 选用 的 是 哪 一 条 信道 ,这 些 信道 在 信息 论 中 被 称 为 
复合 信道 。 这 种 假设 比 文献 L6j 中 解码 者 在 已 知 攻击 信道 的 前 提 下 解码 的 假设 更 鲁 棒 一 
些 。 事 实 上 ,该 假设 应 该 是 最 严 林 的 假设 。 

定理 3.9 一 个 复合 信道 是 一 簇 输入 输出 字母 表 分 别 为 X 和 YY 的 无 记忆 信道 W = 
(Coles: s ES}, 5 为 状态 集 , 信 道 输出 概率 


Wy" | x",s) = [[Wo | zx,s) (3-19) 
¿=1 


这 里 ,信道 由 状态 s Hi WAA x” CX". 
假设 攻击 者 在 知道 编码 的 分 布 P. 的 前 提 下 使 用 复合 信道 攻击 水 印 传输 或 认证 人 码 ,他 
会 选择 这 样 一 条 复合 信道 ,对 所 有 的 s CS, 
VP OY SW | 280 (ry) < Dz (3-20) 
= ex y EY 
这 里 , o 是 一 个 加 性 失真 度量 ,被 称 为 攻击 失真 度 。 它 和 水 印 失 真 度 o 可 能 一 样 ,也 可 能 
不 一 样 ，D, 是 攻击 失真 标准 。 特 别 地 , 当 编 码 字 由 一 个 具有 独立 同 分 布 性 质 的 输入 产生 ， 
那么 由 编码 字 导 致 的 输入 也 为 独立 同 分 布 。 


P"(z) = [| Pla) (3-21) 


这 样 ,复合 信道 对 于 所 有 s EX, 
XPa) Wy | zs)o (x,y) <S D: (3-22) 
x€xX" yey" 
也 许 是 成 立 的 。 不 过 ,通常 假设 在 一 定 前 提 下 的 所 有 复合 信道 都 满足 以 上 失真 条 件 。 
对 于 复合 信道 的 WIDCSI 码 : 通过 替换 式 (3-3) 和 式 (3-4) 中 对 所 有 1” EL”,m EM, 
Da C) EY" ,以 及 s ES ,分 别 为 
> Pela si) > ee | a” ,27)W7 CD Ci") | 255) > 1— à: (3-23) 
eens = 
以 及 ,对 所 有 m,m CM,m~m’,s ES, 
| (3-24) 
u EV ,FEL a” ex" 
对 于 WIDCK 复合 信道 : 通过 替换 式 (3-7) 和 式 (3-8) 中 对 所 有 l EL" ,m EM, Dn Cka) 
CY,, UKS ES, 分 别 为 
>, Pi") > Wr Cka) >) Qa Calu ,ks )W" (Dy zs) > 1—A (3-25) 
aoe a = 
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以 及 对 所 有 mm EM,m £m, 
> PS C0) >) Wr Cal) >) QE Calu", k )W" (Dy Ch, 1258) < A (3-26) 
Pom eae = 
这 里 , Q,,.Q) Dn) 以 及 了 CR) 和 决定 信道 的 状态 是 独立 不 相关 的 。 这 反映 了 
编码 妖 和 解码 器 均 不 能 知道 信道 状态 的 要 求 , 而 且 之 所 以 式 (3-18) 一 式 (3-21) 对 所 有 
s ES 成立, 是 因为 考虑 的 编码 瘟 和 解码 更 总 是 面 对 最 坏 的 情况 。 
式 (3-18) 以 及 式 (3-20) 表 明 , 当 遍历 所 有 M 和 3S 态 ,正确 检测 率 必 大 于 1 一 hi。 
式 (3-17) 和 式 (3-21) 表 明 : 误 检 率 必 小 于 。 当 ) Ae 分 别 趋 近 于 0, 表明 解码 器 检测 成 功 
概率 接近 于 1 ,错误 概率 接近 于 0。 
至 于 模型 [ 和 模型 [中 的 一 般 随 机 性 : 对 复合 信道 ,可 蔡 换 式 (3-14) 为 : 在 任何 状态 
s 控制 下 的 信道 ， 
Pr{FAG|s}<a (3-27) 
此 外 ,因为 不 知道 编码 器 和 人 解码 妖 状 态 , 因 此 函数 政 .G 以 及 编码 字 是 独立 于 状态 s 
的 。 类 似 地 ,对 于 复合 信道 W , 相 应 的 水 印 认 证 码 的 容量 和 一 般 随 机 性 下 的 认证 码 可 分 
别 表示 为 
Ce a ee i es L ee 
W,Rx>D,). 


“3.3 一 般 随 机 性 的 研究 结论 


对 一 个 给 定 的 相关 的 无 记忆 信 源 {( .L 32, 它 的 联合 概率 分 布 为 Pu, 若 无 记 
忆 信 源 为 WW, 失真 标准 为 Di ,QC((V,L),W,D,) 代表 一 个 域 为 VYxLXUXXXY 且 具有 
如 下 性 质 的 随机 变量 的 集合 ,这 里 U 是 一 个 有 限 集 且 其 基数 满足 [U< |V| |L||X|; 
X.Y 分别 是 信道 W 的 输入 输出 字母 表 。 
对 于 所 有 v EV,l EL,u EU,x EX 以 及 yy EY, 
Pr{(V,L,U, X,Y)= (v,l,u, zx,y)) 


— Pytuxy Cusl,u,xz5y) 


= Py, Cv, D Puxvi Cuz | v DW(y | x) (3-28) 

对 于 给 定 的 失真 度 p 
Eo(V, X) < D; (3-29) 
I(Us;V,L) = IT(U;L,Y) (3-30) 


于 是 ,我 们 在 模型 I 中 针对 单一 信道 W 获得 随机 性 编码 定理 如 下 。 
定理 3.10 模型 [含有 边 信 息 的 在 约束 条 件 Di 下 的 攻击 信道 的 容量 为 
CecriC(V,L),W,D,) = max [ICU;L,Y) +H(L|U)] (3-31) 


(V,L,U, X,Y) €QUV,L) WD, ) 
对 于 一 给 定 具有 一 般 (V ,L) 联合 分 布 的 相关 源 、 信 道 W、 正 实数 Rk 以 及 判 据 D, 
支撑 域 相 同 。 这 样 , 式 (3-28) 、 式 (3-29) 以 及 
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I(UsV,L) < I(U;L,Y) + Rx (3-32) 
都 成 立 。 
定理 3.11 模型 [含有 Key 的 边 信息 ,在 约束 条 件 Di 下 的 攻击 信道 的 容量 为 
Corn (VL) ,W5Rx ,Di) = max [I(U;L,Y) + HCL | U)]+ Rx 


(VLU, X, Y EQ” ((V,L),W,Ry D) 
(3-33) 
为 了 描述 复合 信道 的 编码 理论 ,需要 重新 定义 符号 。 如 同上 面 一 样 ,对 于 具有 V XL 
XUXX 字 符 集 的 随机 变量 (V,L,U,X), 分别 看 成 输入 X 和 输出 工 的 信道 , 记 作 Y(W )。 
这 样 ,联合 分 布 Pivuxyrom = Privvx(W),LVUXOY 构成 一 马尔 可 夫 链 。 
对 于 具有 状态 集 SG ES), 复合 信道 W 仍然 记 为 YCWC.|.,s)) 一 Y(s)。 可 以 重新 定 
义 如 下 : 
I(U;L,Y(W)) = inf IT(U;L,Y(s)) 
和 
I(U;Y(W) | L) = int I (U;Y(s)L) 


为 了 方便 , 当 用 Proar 代替 Piwx 时 ,也 记 Y(s) WY 6). 
ICU;L,Y(W)) = I(U;L) + ICUs YCW) | L) (3-34) 
现在 ,对 于 复合 信道 ,我 们 定义 Q/((V,L),W ,Di) 为 随机 变量 (V ,L,U,X) HEA. 
这 样 , 对 于 前 两 个 分 量 的 边缘 分 布 等 于 分 布 Pvi , 并且 式 (3-29) 和 
I(U;V,L) < I(U;L,Y(W)) (3-35) 
类 似 地 ,为 了 构建 Q*((V ,LL),W ,Rk ,Di), 定义 Qi CCV,L),W, Rk, D) 为 随机 变量 
(V,L,U,X) 的 集合 。 这 样 , 对 于 前 两 个 分 量 的 边缘 分 布 等 于 Py 分 布 ,并 且 式 (3-29) 和 
ICU;V,L) < I(U;L,Y(W)) + Rk (3-36) 
都 成 立 , 则 有 定理 3. 12 和 定理 3. 13。 
定理 3. 12 
[ICU;L,Y(W)) + HCL | U) ] 


sup 
(V,L,U,X) EQ (V,L),W,D, 
S Car (V,L) W,D,) 


< inf max [ICU;L,Y) + HCL | U)] (3-37) 
Wew (V.L.U.X.¥Y) €QUV,.L).W: D,? 
定理 3.13 


sup LICU;L,Y(W)) + HCL | U) J+ Rx 
(V,L,U,X) EQ (V.L),.W, Re D, 


= Cern (CV ,LL) W. Re „D; ) 
< inf max [TU;L,Y) + HCL | U)]+ Rx (3-38) 


WEw (V,L,U,X,Y)EQ” ((V,L),W,Rx 5D, ) 


注意 : 定理 3.12 和 定理 3.13 中 的 下 、 上 界 的 间 际 差 取 决 于 inf-sup 的 阶 。 
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_ 34 对 于 水 印 认 证 码 的 结 采 


对 于 集合 V、X、Y 以 及 一 个 具有 基数 |V || XX| 的 有 限 集合 UU, 一 个 具有 一 般 |V] 的 
无 记忆 源 V, 一 个 无 记忆 信道 WW, 以 及 混合 信道 Y(w), 定义 以 下 集合 。 

A. SQ V,W, Rk: D) HAA (vXuXzxxXy) 支撑 域 的 随机 变量 (V,U,X,Y) 的 
集合 ,对 于 所 有 v EV,u EU ,x EX, y EY, 


Pyuxy(v Us Ty) — Py Cv) Pux\y (usx | vW Cy | x) (3-39) 
I(U;V) < IU;Y) + Re (3-40) 
VA Re sk (3-29) AB MIT. o 


(3-40): 有 限 集合 U 和 无 记忆 信 源 V 之 间 的 互信 息 小 于 U 和 信道 输出 Y 之 
间 的 互信 息 以 及 Key 率 之 和 。 可 以 这 样 理解 : 如 果 没 有 Re 这 一 项 , 且 X > Y 是 线性 系 
统 的 情况 下 , 则 可 以 认为 等 号 成 立 。 
B. & Qi V.W.R« ,Di) 为 具有 支撑 域 vXuXz 的 随机 变量 (V,U,X) 的 集合 。 于 
是 ,对 于 所 有 v EV, u CU, x EX, 
Pyux (vsusx£) = Py Cv) Poxiy Cu. x | v) (3-41) 
I(U;V) < I(U;Y(w)) + Rx (3-42) 
以 及 式 (3-29) 成 立 。 XE, TC(U;Y(w)) = infI(U;Y(W))。 
特别 地 , 当 相 关 源 对 CV") 中 的 第 二 个 分 量 L 是 一 个 常数 时 , Q CCV) 
W>R« Di) 以 及 Q CV,L).w Re ,Di) 分 别 变 成 Q™V WRK» Di) M QOV, w, Rk, 
D:). 


定理 3.14 

Cwrs: ( (V. L),W D) = max [ICU;L,Y) + HCL | U)] (3-43) 
(V,L,U,X,Y) € QUV, L), W, D) 
定理 3.15 
(V,U,X,Y) €Q™ (V,W, Rg D) 

定理 3.16 

Camat (VL) sw Lh ) = max [ICU;L,Y (vw) ) 十 H(L | U) | (3-45) 
(V>L»U,X EQ CL) sw, D) ) 

定理 3.17 

__ (V,W, Rk) pe- max [ICU;Y(w)) + Rx (3-46) 


VU, DEQ (V.w,Re.D,) 

注意 ,在 定理 3. 14 和 定理 3.16 中 可 以 加 入 相关 源 的 第 二 个 分 量 LL 的 边 信 息 , 于 是 
可 以 获得 相应 的 较 小 的 界 , 而 证 明 过 程 几乎 不 变 。 

定理 3.18( 均 匀 覆 盖 ) MEL e TE, UG i= 1,2,-°,L2" | 是 一 个 独立 随机 变量 
序列 ,分 布 均匀 的 Tz (8), 对 于 工 和 (2), 让 UgIyz wl") 成 为 {UiC Di 一 1,2,…， 
Lok h A Teer wl") 的 随机 集 。 

对 于 全 部 8& € 00,1] 
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| | TS Cl”) | T? Cu"l”) | 2, 
Pr {| lâ gpr wl") |— Lam Er Lome JH OE Ale A o 2 
o [Tae a | [TH a | 
WR n EER 
| 27a J> 2n | Tog Cl") | 


Ter (v"l") | 

定理 3.19 对 于 nn 型 Pro UC") ,i 二 1,2,1 L2™ 是 一 个 均匀 分 布 的 独立 随机 变 
量 序列 。 设 y WARR, FRA nÆ Pig 和 具有 公共 边际 分 布 Pro EER Prog 和 
Pz = Py， 以 及 所 有 i,Y > 0 和 足够 大 的 7， 


Pr {oe JET Hao CU iCD A) LU Tiro (PU e) ]|> tira? |< a 


如 果 Lam 长 “UIE pw 


3.5 对 于 音 通 随机 性 的 二 搂 定 理 


本 节 证 明定 理 3. 10 一 定理 3. 13 的 直接 部 分 。 因 为 一 个 DMC (离散 无 记忆 信道 ) 可 
看 作 是 一 个 具有 单数 ( 即 | S| = 1) 特殊 的 复合 信道 ,我 们 仅 需 证 明和 定理 3. 10 一 定理 3. 12 
的 直接 部 分 。 为 此 ,对 于 由 变量 vi 乘积 为 文 撑 域 的 有 限 集合 w XXZX 上 的 7 类 型 概 
率 Pera. We ZL PF 3 个 引 理 。 

引 理 3.1 S58 (Uniform-Packing) 

FL ETE, SUL") i= 1,250 12 EET gr CU") 上 具有 独立 .均匀 分 布 的 随 


机 变化 序列 。 且 对 于 任意 T ar C) > Üzr (v1") 为 随机 集合 (UU): i= 1,2,…， 
Fa J} teeter). 于 是 ,对 于 所 有 ss E00,1|: 


| | Te am CoE") | TE a ae CO 2 
P | a ae | nj”) Qna | UIVL > Jna UIVL es<4 R DT2n 
a ve) |— Lam l Th 0| Lem l re 
(3-47) 
| Tag Œ 
对 于 足够 大 的 n l2" J> 2” 一 -上 一 条 件 成 立 。 
aie vl") | 
证 明 : + 
1 U;d") ET jpg OU ) 
Zi(v l) = < (3-48) 
0 U;Ud) ¢ T gpg vl" ) 
Trs W | NeoN -i | 
Kq= TT eT 于 是 | a fin et |= Dd, Zari"), Be = lee el 
UIL ` — 
根据 Z: Col) WU: 的 定义 ， 
TOS na q z= 0 
Prio T je; = | (3-49) 
L—yF 50 
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Chernov 边界 的 定义 可 知 ,如果 [|2” J> 2g", 则 
La" | 
Pr > LP) >L2™ |gd+e) 


en 
”#2™ bite) = », Zer) 
2 2 
<e Ee? 4 4i 
L2™ ] 
一 @ Sl2" hte) | Eet i 


¿=1 


一 eo $2 bite) [1 十 (ez — Lg 1 
| | 2 Lan" | 
—£2" cite | =. = 
< exp. | 2 Lom Jaa +e +E L2 lg(1+4 ) | 


一 (3-50) 
这 里 ,第 一 个 不 等 式 遵 循 Chernov 界 ; 由 式 (3-49) 可 知 第 二 个 等 式 成 立 ; 第 二 个 不 等 


式 成 立 , 是 因为 ef <1+£4 (E). 假设 e 二 1,ef 二 et 二 2; 第 三 个 不 等 式 遵循 不 等 


式 1 十 zx 二 e。 类 似 地 ,可 以 得 到 
La™ | 
Prò YZ." ) 去 L2m Jad — ea) < 26% (3-51) 

wi Lo J> 2g. 

最 后 ,结合 式 (3-50) 和 式 (3-51) ,可 以 得 到 该 引 理 的 结果 

引 理 3.2 填充 (Packing) 4 Pro 为 类 型 概率 ,而 且 Y 是 一 有 限 域 集 合 。 对 一 
l eT? ,假设 Ui(P) i= 1,2,…,L2” 是 一 均匀 分 布 于 Tz() 上 的 独立 随机 变量 。 
于 是 ,对 于 所 有 n- 类 型 以 及 具有 普通 边缘 分 布 的 Pr M Py = Pr. MAi.y>oOUuRe 
够 大 的 nN. 


Pr{ gi Ts FIEU (27U;C2")) 17 LU A TT || > eo < 2 一 全 7 
(3-52) 


WSR Love J< “CIE ar, 


Pee a 


UILY 
这 里 ， Uy TD a FT wary 分 别 是 Eao (Lu”) | Ci" su”) ET Fp a ae Ce. | L” ET > 
Al Tarr Cy | Cy) ET iy 的 通常 的 值 。 
证 明 : 对 于 1 二 Be 上 y” ETS 一 了 了 >， 令 
A . l y” E Uz Lao C2"7U ; CL") ) | | 
Žo") = a (3-53) 
0 y” & (dpi taia (TUAL)) 
及 对 于 所 有 w" CTE UD 
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SG) = T erg Ce ON | LJ Pare CUS?) | | L394 
jži 
因此 
Sa") = > ZO» (3-55) 
?ET Tau 
并 且 


EZ,(y")= Pr{y" € U T hro CU) S< 3 ET rs UU; 1))} 


= Š Pr{U U) ET hgy Cy) } = (ae — 1) DEY. geo ger (3-56) 
ji LOT 


如 果 |2™* I< - D7 9- 


U|LY 
H xk (3- eae E S,(u") S tgo? W, 
ELS;U;CF)) | U: ] < tgga? T (R. TE, 
E SAUVI ELES UGO UA] eer (3-57) 
从 而 ,根据 Markov’s 不 等 式 ,有 


alna] 


Pr (zc 12,5: (U;C")) = tyr 52 7 |< Q-27 


BP sR (3-52). 

引 理 3.3 多 位 填充 (Multi-Packing) 

在 前 面 引 理 的 条 件 下 , 令 Und), i= 1,2, 2%° l2 J, k= 1,2,1,2" 为 一 给 定 的 
l ETT 下 的 独立 均匀 分 布 于 Tz O 的 序列 ,因此 ,对 于 所 有 前 面 引 理 中 的 n- 类 型 的 
Pray 和 Pror 


L2"Fe | 2"P1 
| ] n n n 一 用 
Pr | oma] > pa QT ice CU. kL") YE) CU Theo CUa || > troi "| 
\ | k=1 i=1 
< 2727 (3-58) 
gn 


L2" J< - ays 


Mar Aer 


U |L Y 
证 明 : XIF u” ET sir tar A 
Sia = |T hzo Cu ALU The CUa) ] 
ji 
可 得 到 在 前 面 式 (3-57) 证 明 中 已 经 看 到 的 
E S; U) < tggg?™ 
于 是 , 式 (3-58) 可 从 Markov 不 等 式 得 到 
现在 ,转向 定理 3. 12 的 直接 部 分 。 
引 理 3.4 (定理 3.12 的 直接 部 分 ) 。 对 于 一 复合 信道 WW 
Cr ((V;L).W.D,)> su LU: L,Y(W)) +H(L | U)] (3-59) 


(VLU, O EQ Feige W,D, 
WE RH : 


我 们 需要 证 明 , 对 于 一 给 定 的 相关 无 记忆 源 具 有 一 般 的 V,L, 一 复合 信道 W,(V,L， 
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U.X) EQ ((V,L),W,Di)，, 而 且 足 够 大 的 2 已 存在 的 图 数 下 ,G 以 及 zm(w ,1") 满足 
式 (3-10) 一 式 (3-13) 、 式 (3-22) 式 (3-15) 和 以 任意 率 接近 ICU;L.YCW))+ HCL | U) 的 
式 (3-16) 。 

显然 ,一般 随 机 性 的 可 达 率 集合 是 有 界 和 封闭 (紧密 ) 的 。 不 失 一 般 性 ,根据 均匀 连续 
的 信息 量 , 可 以 假设 E,(V,X) 二 Di 以 及 ICU;V,L) 二 I(U;L,Y(W))。 

因为 I(U;V,L) = 1U;L)+1U;V | D  1CU;L,YW)) = IU;D)+ICV;YW) |L), 
所 以 存在 一 个 足够 小 但 正 的 篆 数 <, 这 样 ， 

ICU;L(W) | L)—I(UVU;V | L) >é (3-60) 

同样 ,也 可 假设 Pu 用 一 n- 类 型 概率 简化 表示 。 于 是 ,对 于 任意 > 0, 根据 信息 量 
的 均匀 连续 性 ,可 以 找到 0 ,6; 二 0 具有 以 下 性 质 : 

(1) 对 于 具有 类 型 Pr = Pr 的 所 有 "ET? (6), BATE > O. Ww") ETS), 
Tr) CTi). KH, Pri Ww") 的 联合 类 型 概率 分 布 , 且 Pi = 
Pr Py 。 

可 以 把 一 个 ETL). ("lM") ET (6;)，(61,6;) 二 元 组 的 (vw ,1") 序列 记 为 
(Oi ,0 )- 类 型 的 序列 TC ,6;)。 

可 以 要 求 当 0 一 0 时 ,6 一 0。 更 进一步 (参看 文献 [9」) ,存在 正 数 G = OO), Oe = 
Co C102); E = E s), 于 是 

Pi (TiC) > 1—2 (3-61) 
Ph (v's Cl) ETCS 82) | 2) > 1-27 (3-62) 

WF ETO), 以 及 
P? (T*(0,.d2)) > 1—2" (3-63) 

(2) 对 于 所 有 具有 类 型 Pn EPz Wl CTI), PUL” XU 找到 一 个 联合 类 型 
的 具有 边缘 分 布 Pr 和 Pu WEYI) Pro., 该 序列 足以 接近 Pi (将 在 以 后 特别 说 明 ), Pr6 
由 2 的 Pz 产生 。 

(3) 对 于 所 有 具有 类 型 Por EPrr WH Cl) ET” 02), 可 以 找到 一 个 在 VXL” 
XU” 中 的 联合 类 型 的 具有 边缘 分 布 Pvr M Pro 而 且 足 人 够 接近 Pru (将 在 以 下 特别 说 明 )》 
的 序列 Pyro. XE, Pro 由 Pr Æ. Pyro 由 联合 概率 Pyr 和 (vw,W") 产生 。 

(4) 对 于 所 有 具有 联合 类 型 Por 以 及 Por 产生 的 联合 类 型 Pro 的 (6 ,0 )- 序列 
C, l), S (V, LU, X) 为 具有 联合 分 布 Pviox 的 随机 变量 , 则 对 于 vEV, LEL, u€ 
U, rex 

Peror (ool,u,x) = Pris (volyu) | vlsu) (3-64) 


OO 


LEL, u EU, xz EA,y EY 


Peor visti te) = Pog (wiv We | sy) (3-65) 
在 式 (3-64) 中 ,任意 的 W Ew 以 及 Pyrix， 以 下 不 等 式 均 成 立 。 
EW Xj (3-66) 


29 


隐 窖 的 原理 及 应 用 


| H(L) — H(L) |< e (3-67) 
Bice | LY TO | Lil ee (3-68) 

并 且 
| IU Y (w) LOIU; Y | L) |<e, (3-69) 


这 里 , IU ;7 (w) | L) = infye.I(U ;Y (W) | L). 
对 于 任意 小 且 固 定 的 €290 < sz < sé ZK (3-60) 中 的 fcc, 的 选择 太 小 ,以 至 于 &1 一 
I a | 
gm 以 及 El < Qo 
IU Yo | o £ P Tee) | be (3-70) 


并 且 , M= 2” 是 一 整数 。 注 意 , 根 据 式 (3-70), 可 以 选择 a 任意 接近 I(U;Y(w) | 工 ) 一 es ， 
从 而 通过 选择 任意 小 的 s 让 其 接近 I(U;Y(w) | 工 ) 。 于 是 ,通过 式 (3-60) 式 (3-68) 和 式 
(3-70) 可 得 


| Ly ROY | DI =a > IU ;V | DE (3-71) 
通过 选择 el 一 se: = Le, 最 后 的 不 等 式 成 立 ,根据 式 (3-69) 和 式 (3-70) ,有 


EU | Yo ey = CT ‘Y (w) | L)—> (3-72) 


[TEU | L ETEA | Th LD | Wl) EThr WEDS tor M toor 


7 itt, log 7 li pr FERED D. 


这 意味 着 ,在 我 们 的 假设 下 ,7 es 二 了 , 式 (3-71) 意味 着 ,对 于 所 有 由 (e1 ,es) 典型 
序列 Por 联合 产生 的 类 型 Poco. 都 有 


ge, oir < 27 =M ESEJ 


Lo Yi 
FES Qu T) 为 条 件 类 型 Prifr 的 集合 ， 二 元 组 的 序列 Cw) 存在 一 具有 
T= Clu") © fe sri (lu”, T) KW Cw ,这 里 , Pro 是 (7" .u") A Prova) 的 类 型 ,是 
式 (3-65) 中 的 边缘 分 布 。 于 是 


TT (3-74) 
Y|LU EQ lu” oT) Wew 
并 且 
| Qe Cu". T) |< a G75) 


再 次 ,对 于 | TU |. eT BEWE tps Togs Cy. Cy") ETA 的 


WET» lim Llog toT = 1(U;Y | L). 


LIEY 
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于 是 , 式 (3-72) 中 的 结果 导致 所 有 由 联合 u”) ET ~ WR Pyro EQw(lu,, T) 
产生 的 (61,6;)- 类 型 序列 Pera. 


(3-76) 


WR 工 很 小 (依赖 于 e) ,那么 对 于 所 有 Price EQw Clu ", T) 


IU;Y |L) I Yo) | L)— Tez 


(回顾 其 定义 ) IU ;Y w) | L) > inf IU ;Y (w) IL). 


36 编码 方案 


3.6.1 选择 码 本 
对 于 所 有 具有 类 型 Pr 由 Pr 产生 (参见 3.5 节 ) 的 Pro KI CTE (86), 应 用 引 理 3.1 


页 式 增 长 ,如 果 n 那么 对 所 有 由 Pr 产生 的 具有 类 型 Pro WL" E 
TiC), 通过 式 (3-73) 和 式 (3-76) 可 以 找到 一 个 子 集 u(W") ETi WU), 该 子 集 具有 以 下 
特性 : 

如 果 Cv" 0") ET"(61,6:) 并 且 具 有 由 Prr 产生 的 联合 类 型 的 Pyz 和 Pyro (AWM 
3.5 节 ), 则 


| es $F 
luge wl) I— ME |< M (3-77) 


ae lor 
WHER e > 0 (4 n> w,e>0), XE, | 
ugye Cl) Aull") N T zpr Col") (3-78) 
Pro 由 联合 类 型 的 (8 ,6 ) 典型 序列 ClO 所 产生 ,而 联合 概率 Porro 由 具有 边 
缘 性 质 的 Pro 和 任意 Prize EQw uy A)T) 所 产生 (注意 ,， Qwl"u".T) MK MF 
u”) 的 分 布 Pre 1) 。 对 于 任意 Porro 和 任意 Pror.» 


Mr D [Thee EN LU T Ho la, E) |< 2 ty (3-79) 


如 果 表 示 ul) WCE ar"), wl"), ，…， 克 Wi) 。 通 过 式 (3-75) 以 及 事实 上 的 
Psu), O”, u”) 具有 相同 的 类 型 Qw (Fu") = Qzm(C u"), W 


M 
M* 2, Te ce C moon | U LJ Tire Cu", uy) |) <2 Peto pg 


aii Py pg EQw I , (yy 


(3-80) 
我 们 称 子 集 ul") 为 编码 字 UO Bel") m = 1,2,…,M 的 编码 本 (codebook)。 
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3.6.2 选择 输入 序列 通过 信道 发 送 


发 送 者 根据 观察 到 的 相关 源 的 输出 Cv" O 以 及 他 本 人 的 私有 随机 数 选 择 一 输入 序 
列 x” EX”, 具体 如 下 。 

在 信号 源 的 输出 是 具有 联合 类 型 的 PrF 的 (61,6;) 类 型 序列 Cv" 2") 的 情况 下 ,发 送 
者 在 Ua 97 Cv" 1") 中 随机 均匀 地 选取 一 个 序列 (参见 式 (3-78))( 如 使 用 他 自己 的 随机 
数 )。 也 就 是 说 ， 


Wa LOU Gi Fr Cv" 2") CUCU") (3-81) 
接着 ,发 送 者 选择 一 SOA BER r EX" 的 输入 序列 。 
Pxvv (x | u” 7 Y (3-82) 


使 用 抽取 的 Ta 以 及 他 目 己 的 随机 数 , 并 且 把 它 通过 信道 发 送出 去 。 

其 他 情况 ,例如 , 非 CO, ,6;) 类 型 序列 输出 的 情况 ,发送 者 选择 一 任意 固定 的 序列 ,如 
a, 并且 把 它 通过 信道 发 送出 去 。 

这 里 ,随机 抽取 的 码 字 以 及 信道 随机 输入 产生 的 结果 分 别 记 为 可 ”和 和 "，, 将 在 以 下 


分 析 中 用 到 。 
1) 选择 函数 FG 的 文 撑 域 为 A 
今 
J= | QxCHCL)—2e,) | (3-83) 
同时 > € 为 一 抽象 符号 (代表 “RETTER. 于 是 ;定义 
A= { {1,2,°°°,M}X {1 ,2,.… ,J)} } U {e} (3-84) 


2) 定义 函数 F.G 
为 了 定义 函数 ,首先 将 每 一 本 二 CTA) 划分 为 了 个 大 小 近似 相等 的 子 集 , 即 每 一 
[eel 


T> | | | 
子 集 的 大 小 为 oa | fear) -了 | 然后 将 集合 中 的 第 j 个 子 集 并 集 放 在 所 有 TCC 
Ti (1) 上 ,并 且 获 得 一 个 TL (01) 的 子 集 L; ; 以 至 于 对 于 7 = 1,2,.…,J 


yl Til 或 ie) (3-85) 
a J 
C1) EC PRE F. 


发 送 者 观察 信号 源 的 输出 而 且 判 断 函 数 下 的 值 。 

在 信号 源 输出 一 个 (6, ,6;) 类 型 序列 (w ,7") 的 情况 下 ,如果 1" EL,, 根据 式 (3-81) 中 
被 抽取 的 发 送 者 的 私有 随机 数 , FE Cm. J) 中 取 值 。 

其 他 情况 , F = e. 

(2) 定义 函数 G。 

接收 者 观察 相关 源 以 及 y 信道 输出 的 L” 的 分 量 1!”( 边 信息 ) 判 断 函 数 G 的 值 ， 
yn Cla) 一 U Tig CG.) >T). 


PY LU €CQwt"as he Py 


El CTL) 以 及 存在 一 m €{1,2 M RETF y Ee A| U YPC} .如 


m =m 
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dh Į” EL; , 则 | Cr 在 (m， j) 中 取 值 .注意 sm 如 果 存 在 , 则 必须 唯一 。 
其 他 情况 , G =e. 


分 析 : 
1) 失真 判决 
首先 ,再 次 回顾 水 印 失真 测度 o 的 界 , 即 
0<e<A (3-86) 
于 是 ,根据 式 (3-63), 有 


=PrV" LYE Th ODDEL”, X") | (V",L" ¢ Th, (62) 1 
<2™a (3-87) 
另 一 方面 ,在 VL) CT Ee CTh Or) 的 假设 条 件 下 ,通过 定义 V, LU”) E 
Toro 具有 由 Prr 产生 的 联合 概率 Prir 。 由 式 (3-65) 3-66) UR CU", XO 的 定义 ， 
有 
~E[p(V”",X”) | WL") ¢ Thr 


— > Pera (ws yu) D Pxmu (a | Us L,u)o(uv,x) 


(vd, w) E VXLAU 
=Ep(V ,X) < D; (3-88) 
因此 ,从 式 (3-87) 和 式 (3-88) 可 得 ,对 于 足够 大 的 n, 
LEV", X”) 
n 
=Pr((V",L") ¢ Th, (2) )ELoV" X=) | (V",L") ¢ Th, (2) J 
+ >) Pr((v",L") ETS (0)) ELV", X | VLO ET? 


ia ii 0, 
VLCO'V LS ) 


< Di (3-89) 
2) 近似 均匀 性 的 条 件 
由 函数 下 的 定义 可 知 , Pr{F = e} < Pr{(V",L") € TT. (6)} 二 1 一 P” (Th (6,)), 
以 及 式 (3-63)， 
| Pr{F = e} —| A| 三 max{2 ,|A| }—>0 (n> œ) (3-90) 
下 面 固定 一 具有 Pr RWW ETEO), $ Pro 是 通过 Pr 产生 的 联合 概率 ,以 及 令 
Q(LU) 为 具有 边缘 分 布 Pro 的 联合 Pyro 概率 的 集合 ,而 且 由 某 些 (61,6;) 序列 产生 ， 
于 是 , Pr{DU = u" | L" = l} > 0 RE u” UC") 一 (人 (im :7 一 1,2,…,M)}) 的 条 件 
下 成 立 。 
此 外 ,由 编码 方案 ,对 于 具有 联合 类 型 Prr 的 (61 ,6,)- 类 型 的 序列 (vw ,1") an) E 
UC"). 
PA | 
Py, VW" =v" | 2") | Uawr wl) | uh") CUR FE t") 
1 i UC 


(3-91) 
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回顾 式 (3-78) 可 知 , 对 于 所 有 l ETE CTE) Ta) EUG) 
PiU = gE = 0} 


= >» pS wt OD Col”) [7 (3-92) 
Pr TG EQLU) v "ETS ray TT, Jd") 
FH sk (3-77) AY 49 
| | T> =) | | | 
[MA +e)? ——8 ez Wl”) | 
| T gpr ol” | 
| a (LC Te OE | oe 
< [MA —e)] ITE wil) | (3-93) 
男 一 方面 ， 
x > ter) | THC) | 
| Pris | Te yr Cul") | 
Por GE QLU)s" aT a) U|VL 
| T ~~") 
= >. | Pate er? | eo 
PF TT EAL WET. pg TY) IT; viz C2") | T iwi rt) | 
= » Pana aaae 
Perg EALU) 
= Pr{(v",l") ET” s02) | 1") (3-94) 
这 里 ,第 一 个 等 式 成 立 是 因为 Ph | 1") een TAER "依赖 于 v” 的 条 件 概 
mar mar t~ a 
率 分 布 ;第 二 个 等 式 成 立 是 基于 — == 的 事实 ;最 后 一 个 等 式 成 立 
VILEGITLT LyU| T am LU 


是 因为 Pyro 由 Pyr 唯一 地 产生 (参见 3.5 节 )。 
因此 ,结合 式 (3-63) , 003-92) ~ 3K (3-94) A: 对 于 一 7 盖 0, 当 n 一 w,e 一 0 时 ,yn 一 
0。 F l ET op Wad) EUC), WAF: 
Q—pM < Pr{U" = ac") | L=} < Q +pM”, (3-95) 
于 是 ,对 于 m E141,2,…* ,Mi,j E11,2,*……,J}， 
Pr{F = (m,j)}= PAU oD EL;} 
= >) PiU") Pr{U" = an") | LD=’yat+tyM"'Pid,;) 


MEL, 
(3-96) 
因为 | T [> LEDD 对 于 足够 大 的 n, 由 式 (3-62) 和 式 (3-78) 可 知 - -二 pee 
并 且 由 式 (3-85) 可 知 
: Tr | _Tr 3 gs. 
nT E 7 7 (] +275) 


因为 Pil") BYE OU", 这 意味 着， 
PEL; ANTP <JUPRCT?) +2) 
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从 而 
Pi (La) < Pi(TiC IT A+ 2") (3-97) 
与 式 (3-96) 结合 , 则 
Pr{F = (m,j)} < M `J +n) (1 十 2 )PL(T?(0)) (3-98) 
类 似 地 ,可 得 
Pr{F = (m,j)} > MJ A— (1—2 2)P:(T?(0)) (3-99) 


至 此 ,结合 式 (3-61), 式 (3-98) MA (3-99) 意味 着 : 4 n> o, > 0, HF—y > 0, 
7 一 0， 


>, | PriF = (m,i) -| Alt |< 7 (3-100) 


连同 式 (3-90) ,就 完成 了 近似 均匀 条 件 下 的 证 明 。 
(1) 率 。 
在 式 (3-70) 中 ,可 选择 
a I(U;Y(w) | L) 一 e 对 于 任何 e 有 es， <e 一 zé 


FE ZK (3-63) IÈ (3-83) . 式 (3-84) 和 式 (3-100) 够 大 的 情况 下 4 n>, y +0, 对 于 一 
7 > 0.4 一 0， 
1 


~H(F)> Hog | A |- > Us Cw) |D—e + HCL) — 201 — 
一 TIU;Y(Cw) | D +10;L) + HCL |U) — e — 2a — 7 
= 1(U;Y,L(w)) + HCL | U) —e' — 2e, — i 
(2) 错误 概率 的 估计 。 
仅 在 以 下 3 种 情况 下 错误 会 发 生 。 
情况 1: 
源 输 出 一 个 概率 小 于 2 的 非 (61 ,6;) 类 型 的 序列 ( 见 式 (3-63)) 。 现 在 假设 输出 的 
是 一 具有 联合 分 布 Pyz 的 (61,6;) 类 型 序列 l), 发 送 者 首先 选择 一 (1") E 
Ua vi (v" ol"), 接着 根据 他 的 私人 随机 数 通 过 信道 发 送 x", 信道 的 输出 为 y” CY". 接着 ， 
在 情况 2 和 情况 3 下 错误 会 发 生 : 
Ye 
SS Pee | ee eee 


x EX 


= PF FEE Cy" | et ate ll). 


情况 2: 
假设 W EW 信道 ,抽取 一 人 码 字 (2) Ua rr wl") CU" Cl"), 此 时 信道 输出 的 序列 


y EY, CU") = LJ Ti ig ETa) T) 


Pigg EQU” i p D 
由 式 (3-64) 和 式 (3-65) ,信道 输出 一 序列 oy CY” RREAK (VL) = 
Cu", l) €T"(61 502) WHR U” = anll) CUs rz Cv" I") 的 条 件 下 产生 的 。 
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Pris = | = ae = CO Sa 
= DF ale |e er ee es | 2 )) 
x" ex" 
So ie we a (3-101) 
另 一 方面 
TC TT TY 
因此 ,这 样 的 错误 发 生 的 概率 会 随 着 n 的 指数 增长 而 消失 。 
情况 3: 
选择 一 码 字 wl") 以 及 一 信道 输出 y" EY NA LU Y |e 由 式 (3-91) 、 式 (3-93) 和 
式 (3-95) ,并 且 经 过 简单 计算 ,可 得 


Re pao} Py.) SE < P{W =u | Lt =U" = 0") } 


LVE 


Le Pe | 7”) (3-102) 
UIVL 
对 于 具有 联合 概率 Prr UM ünl) CUR Fz wl") 的 (0 82) 典型 序列 (v" 1"), 
| tear 
这 里 , Poro 由 Prr 产生 。 因 为 上 7 六 一 Stomp = tgrt. X FAR l, 


EFIE 


ae Cv" | l”) 的 值 通过 过 条 件 概 率 依赖 于 ae 


(3-103) 


Phy Col") TE = Ph, ol") EE = PL Thr OD | 2) — 


U|VL VILU VILU 


Co", l u") ET prp lim n — (logP§ zo r | Fae log 


VLU ? 


)= 0 (3-104) 


VILU 


对 于 具有 联合 概率 Prr 类 型 的 (61 ,6;) 典型 序列 C, l), EnC) CUg Fez Cv" 1") 以 
及 足够 大 的 n, 4n—> 0,0> 0, 选取 0 一 sath 
因为 Pr{(V",L") = (v", l), U” =u"} >0 RAF (v" 0") 是 (6,6;) 类 型 以 及 uw” € 
Pi Sy | var — a} 


=) PV =v | L*=2,U" =H, } 
oar 
PI S| a i aS 
<= >: eD Re (v" | ig le WE a T ana Cy" | Fal) 
vev” 
2 ane Cy” | l",u,Cl")) (3-105) 
XIF l ETE), Tn) CUM) WR y EY", 如 果 W EW {Rik . A AHR 
积 概率 分 布 Pioro O | Con) 表示 的 上 界 , 其 值 通过 条 件 概率 依赖 于 Y”。 结果 由 
式 (3-80) 和 式 (3-105) 可 知 : 对 于 所 有 具有 联合 概率 Pra. Price EQw (Mi,([),T)， 
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l ETI), TAC CU") 以 及 足够 大 的 n, 
M 
M` X) Pr{Y" ET hg Con EDNA [U Yu e) | |L" =r, U" = any) 
— m =m 


< (n+ 1) ILIIU IYI 2-208 
at (3-106) 
最 后 ,由 式 (3-95) 和 式 (3-106) ,我 们 获得 了 一 个 在 条 件 L" 二 ETL) 下 的 错误 类 
型 发 生 概 率 的 上 限 
D Pr (U" = Tp OL" = PPr| 7 Cm CON LU Yw @ IL = 2,U" = zl 
m =m 


M 
一 (1 +) JM Pry” Ey ON LJ Yw CU") [IL = FU" = nC") | 
m= 二 1 m =m 
< (D2 (3-107) 
M 
因为 定义 ; 对 于 所 有 LC ETL), X Pr(U”" =a, 0") | L" 二) 二 1, 因此 完成 了 
证 明 。 
推论 3.1( 定 理 3.10 的 直接 部 分 ) : 对 于 所 有 单个 信道 W 
Coa (VL) WD > | [IU;L,Y)+H(L | U)] (3-108) 


VOLLU,X,YIEQUV,L).W; D. 


引 理 3.5 (定理 3.12 的 直接 部 分 ) : 对 于 所 有 复合 信道 W 
Cru ((V,L) W,R« D1) = sup [I(U;L,YCw))+ HCL | U) | Rx 


VLU, DEQ? UV, L) w, RgD]) 
(3-109) 

证 明 : 和 以 前 引 理 的 证 明 一 样 ,对 于 复合 Eo(V ,XX) 二 Di 以 及 某 些 E 二 0 的 (V,L,U， 
X), 已 足以 证 明 IU;LYCw)) + HCL | U) + Rx 的 可 达 性 

IU;Y(w) | L)+Rk—IU;V|L) >£ (3-110) 

Æ IU;Y Cw) | L) >IU;V | L) 的 情况 下 ,由 前 面 的 引 理 可 知 : 在 无 噪声 信道 缺失 
的 情况 下 , 1U;LY(w))+H(L | U) 也 是 可 达 的 。 因 此 ,发送 者 和 接收 者 之 间 也 许 会 产 
Æ n(I(U;LY(Cw)) + HCL | U)) 比特 的 一 般 随机 量 。 同 时 ,发送 者 通过 无 噪声 信道 向 接 
收 者 发 送 Rk 比特 的 私有 随机 数 造 成 xaRk 比特 的 额外 的 随机 量 。 这 就 是 说 ,随机 量 的 概 
xH IU;L,YCw)) + HCL | U) + Re 时 是 可 达 的 。 

下 面 假 设 I(U;Y(w) | LL) <1U;V; | 工 ) 。 进 一 步 , 可 假设 TU;Y(w) | L) >0, N 
4 I(CU;L,Y(w)) + HCL | UD +R, = 1U;L) +H |U) +R = HCL) +R, 其 可 达 
性 如 下 : 

在 证 明 前 面 引 理 的 编码 方案 中 ,将 TiO) 划分 成 Lj;,j = 1,2,…,J 获得 了 n(H(L) 
—2e,) 比特 的 公共 随机 量 。 男 外 ,通过 无 噪声 信道 也 得 到 了 nRk 比特 的 随机 量 。 于 是 , 足 
以 假设 : 对 于 一 0 二 & 二 Rx 的， 

0 一 TIU;7Co) | L) <KIU;V| L) <IU;Ylw)| LY + Re -€ (3-111) 
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我 们 将 使 用 具有 联合 概率 Pro Pyro 的 (0 ,6 ) 序列 ,以 及 定义 在 前 面 引 理 证 明 中 满 
fe sb (3-65) ~ 3b (3-69) AY sh (3-64) Ast (3-65) PAIBAPLE VLU, X AVL ,U， 
X,Y (w)) 代替 式 (3-70) 中 的 a, 现在 选择 Bp > OMB 三 0, 对 于 任意 小 但 固定 的 e, 
0 <e: < + 这 样 


IU;Y w) | L) — Ser <B < KUY) | L) — e (3-112) 
IU;V| L) —I1CU;Y(w) | L) +&€< BR S Rx (3-113) 
并 且 


注意 , 式 (3-114) 保 证 了 永存 在 而 且 是 正 的 。 
将 不 等 式 (3-112) 和 不 等 式 (3-113) 的 两 边 相 加 ,可 得 


B +e > IUsV|D+ (一 Se ) (3-115) 
并 且 , 由 式 (3-112) 和 式 (3-114) 中 的 第 一 个 不 等 式 , 可 得 
Br + Be + Be > IMsY Cw) | L) +R — Se (3-116) 


令 6 一 >es 一 27 并 且 重 写 式 (3-116) 为 
Bi +B > 1U;V | L) +27 (3-117) 
通过 选择 es < le. p> E >o, 


下 面 与 前 面 引 理 的 证 明 一 样 ,固定 一 任意 小 的 正 数 ez 、y, 选择 足够 小 的 se， 这样 es 一 


min (5e) 。 于 是 ,由 式 (3-69) 和 式 (3-114) 中 的 第 二 个 不 等 式 , 可 得 

&<IWU;Y w) |L)— = (3-118) 
并 且 , 由 式 (3-70) 和 式 (3-117) ,有 

& +B > IU ;V IL) +> (3-119) 


不 失 一 般 性 ,假设 2 、2" 和 2" 都 为 整数 ,而 且 记 为 M, = 2%, I = 2%, K'=2" 。 
与 前 面 引 理 的 证 明 相 似 , 我 们 知道 ,对 于 足够 大 的 2、 足够 小 的 工 , 所 有 由 (6 0.) BR 
型 序列 产生 的 联合 概率 Prir 以 及 在 前 面 引 理 证 明 中 的 Qw u”, T) 


guy UIE i MT (3-120) 
LOVE 
m H. 
frir | 
M, < 2032 Ut (3-121) 
LIEY 


对 所 有 Pro EQw u”, T) 都 成 立 。 
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编码 方案 : 
1) 选择 码 本 
MAPA ET? (0 ) ,分别 用 a 一 Bi 十 Bs IR y= r 替换 定理 3. 18 和 定理 3. 19 中 的 
a Aly 的 方式 选择 一 码 本 。 于 是 ,通过 随机 抽取 ， a ToU (tps {m 00) 
m =l,2," -,M;}, Hr; = 1, 23° ee 如 此 ,对 于 所 有 l ETT) 
U* E) =|] Ua") (3-122) 
并 且 , Ue FET) =U* O N Tapro), O", 同 前 ,并 且 混 用 式 (3-122) 中 的 符 
F: 如 果 其 中 一 个 人 码 字 重复 出 现 ,就 计数 两 次 并 将 其 标记 为 不 同 的 元 素 wd") 和 
,(P)， 则 式 (3-123) 成 立 。 


* ge ol") — MT SE |< M1 SE, (3-123) 
LIVE Lar 
而 且 ,对 于 Qw Cl"v" ma ie 以 及 任意 条 件 概 率 Ps LU 
I | 
I Í. (ergy eet +f | LJ LJ T hga Cue) 
c=! m =m oe nF 


(3-124) 

这 里 sh (3-123) AMA (3-124) 分 别 类 似 于 式 (3-77) 和 式 (3-80) ,它们 的 证 明 也 类 似 。 

2) 信道 输入 的 选择 

在 目前 的 模型 中 ,除了 在 模型 工 中 存在 有 品 信 道外 ,另外 还 具有 Re 率 的 无 噪 信道 
发 送 者 选择 两 个 信道 的 输入 如 下 。 

(1) 选择 有 噪 信道 的 输入 序列 。 

在 源 输 出 一 具有 联合 概率 Poi 的 (61,6;) 典型 序列 Co" 0) 的 情况 下 ,由 式 (3-124) ， 
对 于 由 Per PENA Pere UG Fr Vl) 关 Ø. RIRA BENLE i E UG Fz ot") 
HAR U T O, 并 且 根 据 概率 Pxviv C(x” | vlani Cl") ) 选择 一 个 输入 序列 
x", 通过 信道 发 向 接收 者 。 

在 信 源 输出 是 非 (0, ,6;) 典型 序列 的 情况 下 ,发 送 者 通过 信道 发 送 一 任意 固定 的 序 
列 Ez o 

(2) 选择 无 噪声 信道 的 输入 。 

在 相关 的 信道 输出 为 具有 联合 概率 Prr 的 (61,6;) 序列 Cv" ,7") 的 情况 下 ,发 送 者 首 
先 花 费 logI = 28: 比特 通过 无 品 信 道 将 索引 号 i E11,2,…,T} 发 送 至 接收 者 。 如 果 人 码 字 
uml") EU CD CU* (ZW) 在 当前 的 编码 方案 步骤 (1) 中 被 抽取 ,那么 发 送 者 利用 其 余 的 
nRk 一 npBs = np: 二 logK 比特 ,随机 且 均 名 地 抽取 一 独立 于 信 源 输出 的 & €{1,2,…,K ) 
并 且 把 它 通 过 无 品 信 道 发 出 。 

在 一 非 (0 ,9 ) 序列 输出 的 情况 下 ,发 送 者 通过 无 噪声 信道 发 送 一 恒定 消息 。 

3) 抽取 函数 下 和 G 的 公共 域 A 

A> J #ist(3-83) PAN. A 

A=[{1,2,.… ,Mi }X {1,250 ,TX {15,2505 K }X {1,2,.…,J}]U {e} (3-125) 
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4) 定义 函数 下 和 G 

在 证 明 前 面 引 理 的 编码 方案 中 ,划分 Ti) A Lj 二 1,2,…,J ,并 且 令 K, = (1, 
2,° I} X {1,2,.…,K’), 

(1) 定义 函数 下 

发 送 者 根据 相关 源 的 输出 以 及 他 自己 的 私有 随机 数 选 定 孔 数 下 的 值 。 

在 输出 一 (6 ,6;) 序列 Ww") 的 情况 下 ,如 果 在 目前 编码 方案 中 抽取 的 Ll” EL, 
Ti) EU Cl") N Uae o"l"), W) F R On, i k ,j)。 用 抽取 的 & 将 其 在 无 噪声 信道 
的 最 后 nB: 比特 中 发 送 ( 这 意味 着 , (i,k') 已 通过 无 品 信 道 发 过 ) 。 

其 他 情况 :FF =e. 

(2) 定义 函数 G 

接收 方 根 据 无 噪 信道 的 输出 Gk) EK, JXW L 的 输出 分 量 1", 以 及 含 噪 复合 信 
道 W 的 输出 y”EY" 决定 函数 G 的 值 。 如 下 : 

WF m= 1,2," M, i = 1,2,…,1, 今 

Y„: (1 ) = LJ Tiggo (Pu ,i(l") ) 


ee oe FL 
Py ipo EC Qw ay, <TD 


WR FOUR RIB TA Gk) l ETO) 是 源 输出 , 且 存 在 一 mm Et1 2， M}, 
使 得 有 品 复 合 信道 W 的 输出 y” CYNE U ow id}, al EL AG BUAF C, 
m =m 


isk’ sj). 

其 他 情况 : G 一 Eo 

分 析 : 

1) 失真 准则 、 近 似 均匀 条 件 以 及 率 

可 以 确认 失真 准则 .近似 均匀 条 件 以 及 率 

~logH(F,) >A+R+R +00) = (UyY00) | D HRe +001) 
参考 式 (3-117) ， 获 得 类 似 的 不 等 式 
(1 一 7 MD t= PiU" = u sr) L=; g (1 二 7) MD (3-126) 

2) 估计 错误 概率 

首要 两 种 类 型 的 错误 概率 是 由 一 非 (6 ,0 ) 类 型 序列 输出 产生 以 及 由 元 。;() 错误 
抽取 所 致 的 ,而 且 输 出 的 噪声 符合 信道 的 输出 y” CYm.iCl") EA n 的 增加 指数 性 地 
消失 。 

下 面 用 sale All st (3-125) $e UCI") 和 式 (3-80) ,如 同 前 面 引 理 的 证 明 , 可 以 获得 


Mn Dpr{y Y” EY") N [U Yw. Ace 


i=] m=1 


Lef Oe ur, a") } 


(3-127) 
AR Æ SE (3-106) ,最 后 类 似 地 由 式 (3-95) A sh (3-106) 获得 式 (3-107) ,最 后 结合 
式 (3-126) 和 式 (3-127) 完 成 证 明 。 
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_ 37 对 于 随机 性 的 过 定理 


为 了 获得 对 于 随机 性 编码 定理 单一 字母 特性 ,需要 一 个 有 用 的 引 理 证 明 , 这 个 引 理 中 


的 详细 论证 如 下 。 


引 理 3.6 令 (A”,B") 是 一 任意 随机 序列 对 ,并 且 令 C 是 一 任意 随机 变量 ,于 是 ， 


H(A"|C) — H(B"|C) 


证 明 : 
H(A"|C) — (B"|O) 
nl e 
= 5 HA aA O= > HA rsd BO 


> H(A, sÅ, mo s A, 3 D- |C) ~~ > HCA; „A42 ere A, 站 | C) 


上 一] i=1 
= YHA; AmA BOC) — HAm A, BOO] 
t=1 


i 


a [HCA » Arse soe A, rit 万 (A, 有 A, me Sie IC) | 
] 


= 


T > CHCA, |A a1. A, i wo) EE HURIA p =. A, me sie " 


t=1 


— > [HAJA a"n A, Ee” i) — H(B,\A,+1 9 A, Br O] 
上 一 


— [ H(A, | Am sÅ oe A, YS aie »C) — HCR |A s Å+? a." A, ms aie »C) | (3-128) 


(3-129) 


xE, f= 和 [=n 时 , (A,n ,Az ’ e., A, » 万: ) 可 分 别 被 理解 为 A” All i 


引 理 3.7( 定 理 3.8 的 逆 部 分 ) ”对 单一 信道 W 


Cerr VL); W Di) =. | ICU;LY) + H(L|U) | 


max 
(VLU: X Y) E AV, L) WD ) 


(3-130) 


证 明 : 假设 对 于 一 个 nn 长 的 源 输 出 序列 ,存在 函数 政和 KK 使 得 对 于 信道 W” 和 
sk (3-10) ~ 3h (3-16) Kae. W X A Y EAA AKI (V, L) 所 产生 的 输入 和 输出 ， 


记 发 送 者 的 私人 随机 数 为 M, 于 是 , 式 (3-10) 中 用 V.L 重 写 为 
~Ep(V",X") < D, 


进一步 ,由 Fano 不 等 式 式 (3-11) 一 式 (3-14) ,有 
H(F)< H(F) — H(F|G) + ndAlogk + h(a) 
= I(F;G) + ndAlogk +h) 
< I(CF;L",Y") +ndlogk thA) 
= I(F;Y"|L") + I(F;L”) + nàlogk +hQ) 
< I(F;Y"|L") + HCL”) +ndalogk +h) 


EREI 
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= 1(FY"|L") + Ñ HCL) + nAlogk +A) 


一 


= SCFyY LY) + DHL) + nalogk +O) (3-132) 
t=1 t=1 


这 里 ,对 于 z E10,1|,h(z) =— zlogz — (1 — z) log(1 一 >) BURA. DE 
一 个 不 等 式 由 Fano 不 等 式 (3-11) 30 (3-12) ISK (3-14) 而 来 , 第 二 个 不 等 式 由 式 (3-13) 
得 来 ;第 三 个 不 等 式 成 立 是 因为 源 是 无 记忆 的 。 因 为 I(F;V,,L,) S H, 紧 随 式 (3-132) 
前 面 4 行 ， 
O< I(CF;L",Y") —ICF;V",L”) +ndlogk + h(a) 
< [ICF;L"|Y") + ICF;L")] —[ICF;V"|L") + ICF;L”) ] + ndalogk +h) 
= (F; L" |Y") — I(F;V" |L") + nalogk +h) 
= [H(Y" |L") — H(Y"|L",F)]— [H(V" |L") — HW" |L" ,F) ] + nalogk thQ) 
= [H(Y" |L") — HW" |L)]+ (HW? |L",F) — ACY" |L" ,F)] + nà logk +h() 
(3-133) 
为 了 获得 单一 字母 特性 ,分 别 用 V*" 、Y”"、(L",F) 替代 式 (3-129) 中 的 A,B,C, 于 是 
H(V" |L", © — HO"|L",F) 
= p LAV lV ae es a a el eV WN ol of A] 


t=1 


(3-134) 
更 进一步 ,因为 源 是 无 记忆 的 ,因此 有 
HW*|L") = HCV (3-135) 


t=1 


将 式 (3-132) 以 及 HOLY = SYA CY,|L",Y) RAR (3-133) ~È (3-135) ,得 到 
t= 1 


0 = Le Gl — 7 ~~ HCV, \L,) | + > [ 五 (V,|V »Vi42 a "= sV PS a ee FF) 


t= 1 i= 1 


H(Y,|V,n V te a 55 Va mn uy cc" F) | 十 na logk 十 及 (A) 


ee LAG Aly "a ) H (Y; |V Ve eee Vn aks “> di »F) | 


t 二 1] 


E > [HCV :|LD) ~~ HV Vn Ves . iV, my Py sy »F) | + nAlogk +h) 


t=1 


LO Ae ee a MS rar cae 


t=1 


» HY, Vi Vi eV aaa La s Lipi Hala "H FLO T nAlogk +hQ) 


t=1 


=> Li, Viy Vepa aTr eV ely sL a 1T T Layi 7" "re oe »F|L,) | 


t=1 
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0 sV p42 a1." ‘Vc si skag ovr n seri 9 Lan — »F|L,) | 


= 
十 nAlogk +h(A) (3-136) 
& J 为 在 (1,2…,n} 均匀 可 变 取 值 ,并 且 
DV lo is "sb (3-137) 
由 于 J 和 (Vj,Lj) 是 独立 的 , 即 IOJ, V L) 一 0, 于 是 重 写 式 (3-131) 并 且 继 续 以 下 
几 行 。 
O< nI(U;;Y,;|L;,J) —nI U,;V,|L;,J) +nalogk +hQ) 
= nLICU, 3L,5Yy J) — 1@W;3L, J] BE LIU, iV] IL; »J) 
— I(U;;L;|J) +nàlogk +h) 
= nI (U,;L,,Y,|J) — nI (U;; V; L;| J) +nàlogk + ha) 
< nI (U; J; LY) —nlLIU;,J;Vi LD — ICJ ;V;iL;)] +nalogk +h) 
= nI(U,,J;L,;,Y,;) —nI(U,,;J3V,;5L,;) tnalogk +hACA) (3-138) 
下 面 记 
【了 (3-139) 
对 于 式 (3-137) 中 均匀 分 布 的 和 Uj, 显然 ,由 相关 源 (V,L) FER VLO 具有 
相同 的 概率 分 布 ,条件 概率 分 布 Pyw = 二 WW 以 及 (VLU ,X,Y ) 形 成 一 马尔 可 夫 链 。 也 
ae be, VLU". xX". YO MRA AHH Pvroxw = PmPwrxr"wwW 。 连 同 式 
(3-131) ,可 重 写 为 
Eo(V”, X^) = ELEo(V"”, X”) |J] = ELEp(V, .X,)|J] 


= Ep(V",X") < D; (3-140) 
进一步 ,在 式 (3-138) 中 通过 替换 (x* ) 并 且 在 结果 不 等 式 两 边 同 时 除 以 n, 得 到 
ed a i (3-141) 


因为 集合 {Py,ivxy: (V»L.U.X,Y) EQ((V,L),W,D1)}) 是 紧凑 的 ,由 式 (3-139) 和 式 
(3-140) 足 以 完成 证 明 
=H (PF) <1(U"3L",¥") + HO NV”) + 0(1) 
对 于 A 一 0, 可 以 通过 在 式 (3-132) 两 边 同 时 除 以 n 继续 进行 以 下 几 个 步骤 。 


IHF) 
= 


< EDIYA YD + — >) HCL) + Alogk + =hQ) 


a =>) TV i44 SAT — a ee ay ime ) + 一 > HCL.) + Alogk 十 =H (À) 
” t=1 [i 1 


7 
¿= 1 


= 一 > ICV} Vite 9 „Li sda = T ime ms Pere sve oy Me aa , F;Y,|L.,) 


“t=1 


+ =>) HL) + alogk +> Q) 


隐 密 的 原理 及 应 用 


= KUY; lL D +H LIJ) + alogk + Sh) 

< IU; ,J;Y;|L;) + H(L,|J) +alogk + =h QA) 

= IU; ,J;Y,|L;) + H(L,) +alogk + —h a) 

= IU; J;Y;lLi) + IU; LI) + HCL; |U) + Alogk + —h) 
< IU, JYLL) + 1; TL) + HL; |U;) + alogk + =A 
= TU, J sLy,¥,) + HL;|U;) + Alogk + ~h 0) 


— 1(U",L"” ,¥”) + H(L"|U"”) +alogk + Th A) (3-142) 


这 里 ,第 二 个 等 式 成 立 是 因为 Uj; AFJ. 最 后 ,上 界 对 于 U 的 大 小 符合 书 " 中 的 
310 页 。 
引 理 3.8( 定 理 3.11 的 逆 ) 对 单一 信道 W 


Corr (VL) WRK» Di) S LIU;L,Y) + H(L|U) ] + Rk 


EE E rr E N 
(3-143) 
证 明 : @ (0V, LO): 是 一 具有 一 般 (V,L) 的 相关 源 , W 是 一 噪声 信道 , Rk 是 
Key X, D: 符合 模型 [ 中 的 失真 标准 。 令 下 和 G 为 满足 式 (3-10) 一 式 (3-12) 、 式 (3-17) 
以 及 式 (3-14) 一 式 (3-16) 的 困 数 。 在 随机 性 模型 [ (对 于 源 输 出 序列 长 度 n) 中 ,用 X”" 记 
噪声 信道 W” 的 输入 。K, 为 发 送 者 根据 他 上 自己 的 相关 源 的 输出 以 及 他 的 私人 随机 数 确 定 
的 无 噪声 信道 的 输 和 人 人 。 于 是 ,由 Fano 不 等 式 (3-131) 成 立 并 且 简 化 成 式 (3-132) ,可 得 
H(P)< ICF;G) + nAlogk +h) 
< I(F;Y",L",K,) +ndalogk +hQ) 
= I(F;Y",L") + I(F;K"|Y".L,) + nàlogk +hQ) 
= I(F;Y"|L") + I(F;L") + I(F;K"|Y",L") + nAlogk + hQ) 
< I(F;Y"|L") + H(L") + H(K"|Y",L") + nalogk +hQ) 
<S I(F;Y"|L") + H(L") + H(K") + nalogk + AQ) 
< I(F;Y"|L") + HCL") + Rx +ndalogk +h) 
= SVICF;Y,|L" YO ) 十 SHL.) +nRx +nalogk+hQ) (3-144) 


= =I 
由 式 (3-17) 可 知 这 里 的 第 二 个 不 等 式 成 立 。 类 似 地 ,由 式 (3-133) 可 得 
O< I(F;Y",L",K,) —ICF;V",L”) +nalogk +hQ) 
= I(F;Y",L") —I(F;V",L”) + I(F;K,|Y".L”) + nalogk + hQ) 
< I(F;Y",L") —I(F;V",L") + H(K,|Y",L") + nalogk +h() 
< I(F;Y",L”") —I(F;V",L”) + nRx +nalogk +h) (3-145) 
注意 : 这 里 仅 使 用 了 基本 的 Shannon 信息 测量 的 性 质 ,以 及 在 假设 相关 源 是 无 记忆 
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的 情况 下 , 式 (3-133) 一 式 (3-136) 部 分 中 估计 的 TCF) —ICF;V",L"), 所 有 这 些 都 
是 可 得 的 。 于 是 ,这 里 也 有 相同 的 佑 计 结 果 。 
(FeY asl) ICF;V",L") 
<= > ICY Vai oV te a 1T Ve Li P p a 1" oe sbi ere si Oy ie FIL.) 


¿=1 


7 LT Va Vitz paN a ,Li PTT ME re Maer Oo S ile »F|L,) 


= 
+ nà logk +h) (3-146) 
S U; AJ WR (3-137) PENX, FEN G-146) 可 重 写 为 
ICF;Y",L”) —ICF;V"L”) <nI(U,,J3L;,Y;) —nICU;5J3V;5L,) + 
nAlogk +h() (3-147) 
&WV",L’,U".X",Y") 如 前 面 引 理 所 定义 ,于 是 式 (3-139) 以 及 Pyrvxy = 
PyPurxrvwrW 可 实现 。 由 式 (3-145) 一 式 (3-147) 可 得 
0 过 TU 7 —1(U";3V",L”") + Rx +01) (3-148) 
同样 的 方法 ,如 式 (3-142) ,可 以 证 明 


SI: Y,|L",Y) + DHL, ) +nRg +nalogk +h) 


<nI (U”; L”, YO +nH(U” | LO +nàlogk +hQ) (3-149) 
结合 式 (3-144), 则 
~H(F) < < IU”; LYN + HU” | LO +Rk 二 +nAlogkt ha) 


再 次 说 明 ，|x| 被 限定 在 支撑 引 理 下 ,因此 证 明 就 完成 了 。 最 后 , 紧 跟 引 理 3. 2 和 
3.4 的 是 推论 3.2. 

推论 3.2 ”对 于 组 合 信道 W 

1) (定理 3. 12 WER) 

Cor COV LL) W ,DI) < inf max ,LICU;L,Y) 十 HC(L | U)] (3-150) 


WEW (V.L.U.X.YIECQUYV, L),.W,D, 
2) CEM 3.13 的 道 部 分 ) 
Cera (V 了) W ,Rr,D) < inf max [ICU;L,Y) + HW |U))]+R, 


WEW CV,L,U,X,YIEQ* (V,L),W,R,,D,) 


(3-151) 
3.8 由 一 般 随 机 性 构 返 水 印 认证 码 


R. Ahlswede 和 G. Dueck 在 文献 [3] 中 发 现 : 具有 相同 率 的 一 个 认证 码 通常 可 以 通 
过 发 送 者 和 接收 者 之 间 的 随机 性 而 获得 。 在 一 定 的 条 件 下 ,发送 者 可 以 以 任意 小 的 一 个 
率 (Rate) 发 送 一 个 消息 。( 指 数 意义 下 ) 

因此 ,在 特定 条 件 下 ,认证 码 的 容量 不 比 一 般 随 机 码 的 容量 小 。 注 意 : 集合 QC, 
L),W,D:),Q*(V,W,Rk,D:).Q (V, L),W,D:) 和 Q (V.W.Rx ,Di) 都 不 为 空 。 
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Steinberg-Merhayv 关于 具有 一 通常 经 验 的 水 印 传输 码 的 结果 。 

为 了 构建 文献 [6 中 的 认证 码 ,Y. Steinberg 和 N. Merhav 引入 了 一 个 在 发 送 者 和 
接收 者 之 间 建 立 随机 性 的 传输 模拟 获得 容量 范围 的 一 个 内 界 。 这 个 内 界 对 于 他 们 的 目标 
是 充分 的 ,下 面 证 明 它 同样 是 紧 的 。 

BW ha 为 一 具有 字符 集 V 的 无 记忆 源 。 一 般 地 ,VV AW 代表 噪声 信道 ,其 输入 
和 输出 分 别 为 X 和 Y。 函数 (f,g) 被 称 为 具有 一 仿真 失真 测度 p REK D 和 掩饰 文档 
Py 的 (n,M,J ,6,A4,， D) 水 印 传输 码 。 如 果 以 下 为 真 

f Æ— M V" X (1,2,…,M) 到 {1,2,…,J) X X” 的 函数 ; 

g FE— MYX {1,2,-…,J) B| {1,2,-…,M)} WRAK. 


M 
D> >) POW” (y: gy") — (f;Cu"sm),m)} | fx (u",m)) = 1—A (3-152) 
m=1 ney" 


M 
ED EPEC" pCa" fxm) < D (3-153) 


m= 1 at E€ al 


对 于 m 1,2,°°°.M, 存在 一 子 集 B” C {1 ,2,--… ,7,-… J}, 其 欧式 空间 | na | > 
Jo", 这 样 ， 


J O2” <= PE fy" sm) = j} S J72” (3-154) 
对 于 所 有 的 7 和 
>》 Pi{ fs" sm) =j} E1 (3-155) 
(m) 


jEB 
g 在 这 里 起 着 一 个 解码 图 数 的 作用 。 在 接近 均匀 条 件 下 , 式 (3-154) 和 式 (3-155) 在 
从 通常 随机 性 而 来 的 认证 码 的 构建 中 起 着 相同 的 作用 。 事 实 上 ,可 以 找到 近似 均匀 条 件 
式 (3-16) 中 更 强壮 的 条 件 , 但 出 于 构建 认证 码 , 式 (3-154) 和 式 (3-155) 已 是 以 满足 条 件 。 
一 对 (Ri Ro) 称 为 在 失真 D 级 下 是 可 得 到 的 ,如 果 对 于 所 有 正 实数 OA, 均 存 在 一 
上 面 定 义 的 x,M,J ,8,A4,D) 水 印 传 输 码 ,例如 
=logM 2, 6 (3-156) 
并 且 
~log] > R,-€ (3-157) 


可 获得 的 率 对 称 为 容量 范围 并 且 记 为 R。 用 R(x) 记 作 实数 对 的 子 集 合 ,这 样 存 在 
随机 数 (V,U,X,Y) 从 VXUXxXXXY 取 值 , | UI Y | 十 | X|, 对 于 vEV,u EU,x € 
X MH y EY 

Pyuxy(v,u,z,y) = Py Co) Pox (ur | DWCy | x) 
Fo(V,X) <D (3-158) 
Oe Fi =. MU) — IU;V) 
FFA. 
O=. EZ NUV) (3-159) 
这 在 文献 L6j 中 已 经 证 明 。 
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定理 3.20 Steinberg-Merhav. 
R* CR (3-160) 
下 面 证 明 相 反 的 内 在 关系 成 立 。 
定理 3.21 
人 所 天 (3-161) 
证 明 : & (fog) 为 对 于 足够 大 的 ” 满足 式 (3-152) 一 式 (3-157) 的 对 图 数 ( 这 在 随后 
说 明 ), 2Z,、X” 分 别 是 一 在 {1,2,…,J) 上 具有 均匀 分 布 的 随机 变量 。Y” 是 当 信 道 W" 输 
AX” 的 随机 输出 。 于 是 , 式 (3-154) 和 式 (3-155) 分 别 重 写 为 


F722 <= Pia G | Wie 2 (3-162) 
对 于 所 有 7 EB”, FFA 
i Lb. EB” | m) => 1—4 (3-163) 
因此 ， 
HCB, | Z,) 
M 
= >) Pz (m) H(B, | Z, = m) 
m=] 
_ Sp, (m) p2 Ps lz (J | m)logPx iz (J | m) 
m= 1 jc B™ 
- Pps (m) >) Ps iz G | mlog !2™ 
Rm 
M 
= (logJ — n) >) Pz (m)Ps ız (B, EB” | m) 
m=1 
> Clog] — n) — å) (3-164) 
这 里 ,由 式 (3-162) 的 第 二 个 不 等 式 成 立 , 从 式 (3-163) 可 推 得 第 三 个 不 等 式 ,或 者 等 效 地 
， +H, | Z,) 
— logs = Te N (3-165) 


因为 H(B,) < logJ, 式 (3-165) 意味 着 : 对 于 一 个 函数 0, 当 6,A4 一 0, 以 至 于 
0(8,A) —>0, 
一 logJ — 685A) < “HOB, | 2,) < ~H(B, 下 < 一 logJ (3-166) 
也 就 是 说 ，B, MZ, 是 “近似 独立 的 ”。 进 一 步 , 由 Fano 不 等 式 可 知 Z, 独立 于 和， 
R — e< 工 IlogM = 工 HCZ ) 
n il 


— AW, | Vv» 
Ti 


a dh ees | 
< —H(B, »Z, | V”) 


< HHG, Z, | V") — HB, +Z, | ¥")]+AlogJM + =h Q) 
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_ 110, MB ES L hlogJM 十 =n (A) (3-167) 
这 里 的 第 二 个 不 等 式 遵 从 Fan 不 等 式 。 因 为 B, Æ V, AZ, 的 函数 ,所 以 有 
H(B,,Z, | V") < H(W",Z, | V") = H(Z,) (3-168) 
1X Ast (3-166) BEM 
R, —e< Tlog] < H (B, | Z,) +00) 


= THB, ,2Z,) — H(Z,)] +08,1) 


< [H G, Z) 一 H(B,,Z, | V +08) 


= 一 ICB, 5Z, | V) +08,1) (3-169) 
至 此 ,我 们 获得 了 式 (3-167) 和 式 (3-169) 中 容量 的 非 单 一 字符 特性 。 后 续 的 证 明 部 
分 将 其 简化 为 单一 字符 。 
首先 ,分 别 用 V,、Y, UA (Bno Za) REA (3-128) PHY A,B, AC, 并且 获得 
H(V” | B,,2Z,)— HCY" | B,;Z,) 


— 2 [HCV, | Vin »V 42 . … Va „B, ae — 
i=1 
HY. | YY a V 2 oo Pst ais B. "a (3-170) 
其 次 , 记 HV") = >) HOV), 因为 源 是 无 记忆 的 ,并 且 HY = >) H, | 
7% | Trina — n a 
Y=), 因此 有 HV") = >, HO.. 
I(B, sZn3¥") — 1(B,,Z,;V") 
=H(¥") 一 HCV 十 [HCV | B,.Z,) — HO” | B, ,2,)] 
= D> HM. | a 和 >S) HOV») F LHW, | View Vi a 15S Va a Bb, es 
站 = 了 t=1 t=1 
— HCY; | Vaa Vit n a Vn — „B, a Ae ) | 


> LE | Y**) o HY, | Ven A 42 ’ ar VW —— sB, A )] 


¿= 1 
o > LHC.) AV, | Vti Vi 9 Van Pi a D | 
i= 1 
= VV A 2 | 
t= 1 
o > IV ii SV te "ee Va T ai B, an V; ) 
¿= 1 


< > I(Vn V29"" 9sVn SS a B, YA DF ) 


:二 1] 
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~~ SAG a oV 42 ste Va YB ,ZV.) (3-171) 


t=1 


有 


t=1 


n ». ICV n sV er" Va » Bb, i Ae ;V,) 


i=1 


< STV as Vena ot E T EA A (3-172) 


因此 , 令 I 是 从 集合 (1,2，… 天 ，… 72)} 均匀 取 值 的 随机 变量 ,而 且 U’ = (V Ha sV ga or" s 
V, Y ,B,,2Z,) 由 式 (3-169) 一 式 (3-172) 可 断定 


了 一 EU | ID —1U';V; | D 十 hlogJM + =h (A) 


< 1’ ,1;Y;) OANA + 1; V1) +AlogJM + tp (4) (3-173) 
并 且 
R,—-—e<1U';V, | D <—ICU’=,1;V,) + 066,A) (3-174) 
尔 可 夫 链 ,于 是 式 (3-174) 可 重 写 为 


R, 之 TI(U;V ) +08,1) (3-175) 
并 且 
EP (vx) < D (3-176) 
进一步 , I, V) = 0 (因为 源 是 平稳 的 ) ,而 且 式 (3-173) 遵 从 
R, < ICU;Z) —10 3’) 十 MlogJM 十 =n) Je (3-177) 


最 后 ,，|U| 以 归 一 化 的 方式 受 支撑 定理 的 约束 。 


第 4 章 
完善 隐藏 方案 


在 概率 随机 分 布 的 条 件 下 ,对 于 给 定 的 明文 消息、 掩饰 体 以 及 密 铀 (Key) ,本 章 介绍 
了 有 关 完 善 隐藏 的 理论 和 实现 方案 ,给 出 了 完善 保密 性 和 隐藏 性 的 证 明 , 并 提出 了 完善 隐 
密 通 信 算 法 。 


41 SRAM eR 


定义 4.1 如 果 一 个 隐 密 系统 PCOM,K,C,Pv,P,P-,E,D) 满足 完善 隐藏 性 、 完 善 
解密 性 以 及 完善 安全 性 5 , 则 称 卫 为 完全 (Complete) 保 密 的 信息 隐藏 体制 。 表 示 如 下 。 

完善 隐藏 性 : 对 于 所 有 的 消息 mr EM、k CK 以 及 c EX, 存在 隐藏 函数 E(。,，) 使 得 
El(m,k) = c, 并 日 Em,k) 和 ec 的 分 布 完全 一 样 , 即 


Pr(E(k,m) = s) = P. Cc) (4-1) 
完善 解密 性 : 对 于 所 有 的 m EM 以 及 k CK, HERR RA AC, +), Bp 
ACR, E(ksm)) =m (4-2) 
完善 安全 性 : m 的 分 布 独立 于 上 (m,k), Bil 
Prim | E(k,m) =c) = Pr(m) (4-3) 


式 (4-1) 和 式 (4-2) 要 求 Me) AY Ba es dA E FB BA OT — A HE, (4-3) 
WU) BESS fa Ja BAR AY OD Aa A FY BR PK BO SE AR E Aa a tE YB A a Aa A 
密 信 后 的 载体 分 布 相互 独立 。 


Cg) 的 安全 性 证 明 即 对 完善 隐藏 性 、 完 善 解密 性 以 及 完善 安全 性 的 证 明 。 首 先 将 
Cg) 实例 化 ,为 此 引入 一 特征 和 矩阵 集 Hn) 其 定义 如 下 。 

定义 4.2 特征 和 矩阵 集 (H} = {Hn | m EM) FECA m 的 情况 下 ,和 E(k,m) 
的 条 件 概 率 和 矩阵 ,定义 为 

Ha = [Ham P= k,EQRsm =c | m= Mm) herceg (4-4) 

以 后 可 以 看 到 , Fe EY ce Cg) 在 式 (4-1) 一 式 (4-3) 中 的 要 求 ,而 且 能 
够 覆盖 sg) 的 所 有 特性 。 为 此 ,有 以 下 定理 。 

定理 4.1 4 [Hn |= (kos) | Hanks) 40} RRE H, 中 不 为 0 元素 的 坐标 的 
集合 。 
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CA) 如 果 元 组 (M.K.C.Py-Px-Pc.E.D) 为 完善 隐藏 模型 ,那么 
Vm:sm; EM: m; £ m; > [Hn JN [He I= OO (4-5) 
Vm EM: H, X1!°1 = Px (4-6) 
(B) 假设 元 组 (M, K.C, Pr) 以 及 集合 空间 为 |M| 的 互 。( 其 大 小 为 |K|x |C|)， 
满足 式 (4-5) 以 及 式 (4-6) 中 的 条 件 , 那 么 下 述 方案 即 完善 隐藏 方案 。 
PRL EC, +): WAME m EM,k EK, 随机 输出 Pc 一 c。 
xE, Pel = Pr (kh) Halks). 
PRB ACe, +): HA BR c EX,k CK, 输出 唯一 的 消息 m, 
HE, Ho = OO 
WEAR (A): © H = (M,K,C,Px,Px,Pc,E,D), Rue DA. AE k MEC, 
m) 可 唯一 确定 m。 
Vk,m; ~m,;>ECk.m;) Æ E(k,m;) (4-7) 
另 一 方面 ,运用 反 证 法 ,假设 Ymm EM: m Am; > [Hn IN [Hn JAD, Wl 
((Pr(k = Ek,E(k,m) =c|m=m;) #0) 
(Pr(k =k, E(kR,m) = c | m = m; ) #0) 
=> Jk,c: c = E(k,m;) = E(k, m;) 
=> Jk: E(k,m;) = E(k,m;) (4-8) 
ZEA SR (4-7) Fst (4-8) , BREED IGN . AE 
m: # m;>(Hn, IN CH, I= Ø (4-9) 


dksc: 


所 以 , 式 (4-5) 成 立 。 
同时 ,因为 & 和 相互 独立 ,由 式 (4-4) 可 知 : 
H,, (kso) = Pr(k =k, E(ksm) = c | m = m) 
一 Pr(E(k,m) = c | k = km = m)Pr (k = k | m = m) 
= Pr(E(ksm) =c|k=ksm = mr = k) (4-10) 
代入 式 (4-6) 得 
(H, X1!°!)|,= S/H, (kc) 
EC 
= > Pr(E(k,m) = c| k = k,m = m)Pr (k = k) 
P 


= Pr(k =k) >) Pr(E(k,m) = c |k = k,m = m) 
s&s 


= Px (k) (4-11) 
因此 , H, X1!°! = Py, 式 (4-6) 成 立 。 
(A) 证 毕 。 
WERA CB): 假设 式 (4-5) 和 式 (4-6) 成 立 , 则 (CM, K.C, Pk Hn) 符合 B 中 所 述 的 条 
件 。 首 先 , 式 (4-6) 意 味 着 
Do rexceclim (koe) = 1 (4-12) 
4 H,, (koe) 对 应 于 一 概率 , 即 OH, (Roc) = Prk = ka =c | m= m), 这 里 的 a 等 价 
于 E(k,m)。 现在 要 证 明 的 是 式 (4-3)。 从 式 (4-6) 得 到 
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SH RBA Dy A 
Pr(k = k |m = m) = gyre = k,a = c|m = m) 


= OH, (Rk,c) = CH, X 1'1), = Pr(k =k) (4-13) 


EE k #l om 相互 独立 , 式 (4- 3) BRIE. 

同时 ,由 式 (4-5) 可 推断 出 ,至 多 存在 一 个 m, 使 得 Vk,s:A,(k,s) 40, Vk,s:E(k,m) 
二 

由 以 上 推导 可 知 , 对 于 任意 给 定 的 有 & EK,c CC, 至 多 存在 一 个 m € M 使 得 E(k,m) 
= c, 而 且 从 式 (4-6) 可 知 , 给 定 m M Pk) 关 0, 至 少 存 在 一 个 < 使 得 瓦 。(CR,c) ~ 0。 同 
时 ,根据 在 人 算法 下 (.,.) 的 定义 可 知 , 若 E(k,m) =c, WH.) 40. A WEB 
的 m EM 和 kk EK,D(k,E(k,m)) 二 m。 因 此 ,特征 矩阵 满足 对 称 性 。 综 上 所 述 , H = 
(M,K,C,Px ,Pc,EF,D) 满足 完善 隐藏 性 。 


”4.3 ERE A Base ue AA 


定理 4.2 若 给 定 的 信息 隐藏 模型 满足 对 任意 m CM: 
HIX1ISI =P. (4-14) 
则 该 模型 满足 完善 安全 性 和 完善 隐藏 性 。 
WEAR: 必要 性 。 假 设 卫 满足 完善 安全 性 ,由 式 (4-1) 和 式 (4-2) 可 知 
CH XT SH. 


EEK 


一 ,PrCk = k,E(k,m) = c |m =m) 


EEK 
= Pr(E(k,m) = c |m =m) 
= Pr(E(k,m) = c) = P, (c) (4-15) 
因此 , 式 (4-14) 成 立 。 
充分 性 : 假设 式 (4-14) 成 立 , 根 据 An 的 定义 可 知 : 
Pr(E(k,m)= c|m = m) = Prk =k; E(k,m) = c|m = m) 


FER 
= (HZ X1!*!)|.= P. Ce) (4-16) 
Mt (4-16) Say 4g 
PrCECksm) =a= >, Pr (E(k,m) = ¢|m=m)Pr(m = m) 
= >), P.(c)P,(m = m) = P.o) (4-17) 
从 式 (4-16) 和 式 (4-17) 中 可 知 , E(k,m) Shor Fm, Ak. iw ese RSE. IN. 
由 式 (4-17) 可 知 , 式 (4-1) 成 立 。 因 此 , 卫 满 足 完善 隐藏 性 。 
推论 ; 令 卫 是 具有 完善 隐藏 性 以 及 与 消息 的 分 布 相互 独立 ,于 是 卫 被 认为 是 完善 安 
全 的 。 
证 明 : 假设 卫 具 有 完善 隐藏 性 ,从 式 (4-1) 可 得 
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本 >S Pr(Elk,m) = c | m = m) Pr(m = m) 
= pp > Prik = k,E(ksm) = c | m = m) Pr (m = m) 
m k 
= 2. > Hua (Bsc). Prin = m) 
m È 
= > Pr(m=m)(HZ X1!*!) |, (4-18) 


因为 对 于 所 有 m EM, YH m Gk EK 独立 ,因此 有 >)P,(m =m) = 1, 于 是 


Pi =i), (4-19) 
满足 式 (4-14) ,意味 着 卫 是 完善 安全 的 。 
AR 互 方案 中 和 矩阵 集 (Hn) 的 构造 算法 如 下 。 
算法 4.1 
输入 ”整数 clycz，…，c， 
输出 ”整数 上 和 | MI 个 大 小 为 & Xn WEE H , HD, 
如 果 Yi E{1,2,…,n): ci 一 0,， 于 是 
H, Hz; Hn 2 #6 F&F 
k=0 
否则 QS (ec, 十 cs tee +c,)/m 
o 是 (1,2,…,n) 的 一 个 排列 ， 以 使 ca bars a Co, 
0 一 min(Q 一 cc ) 
MTF iC {1,2,°**,m} ,Co SC, 一 人 
XF icim +l,m +2, sn} ,Co EC, 
Hi, H250 ,Hsk = RAMAJ (ci ,cz,… ,cs) 
k=k' +m 
Mt = be m7 =l: m, 
t=((itj)mod m)+1 
把 单位 行 矩 阵 6e。 添加 给 A; 
结束 HH; 
算法 1 是 特征 矩阵 的 生成 算法 。 其 中 (Po Po, ,…,Pe } 表示 原始 载体 的 统计 分 布 ,将 
{ Pe, s Pc, pea Po } 中 各 项 通过 通 分 化 为 整数 ioe oy eee oe 后 ,作为 算法 1 的 输入 。 运 
行 结果 的 输出 为 密 钥 空间 |K| 和 | MI| 个 维 的 特征 和 矩阵 ,其 中 每 行 的 长 度 为 |K|。 


“完善 隐 密 通信 算法 


4.4.1 相关 概念 的 定义 
隐 密 通信 技术 的 目的 是 验证 秘密 数据 的 不 可 抵赖 性 和 完整 性 。 基 于 完善 隐藏 模型 ， 
本 章 提 出 一 种 完善 密 钥 隐 密 通信 系统 。 发 送 方 利用 密 钥 上 把 机 密 信息 m 隐藏 到 载体 内 ， 
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通信 接收 方 采用 共享 密 钥 & 能 够 道 四 从 隐 密 载体 * 中 检测 出 机 密 信 息 , & 可 以 看 作 是 将 
秘密 信息 实施 加 密 或 者 是 处 理 通 人 操作 的 密 钥 ,但 这 样 的 隐 密 通信 系统 基于 一 个 假设 , 即 
能 够 经 过 安全 的 信道 传送 密 钥 。 

引入 不 确定 性 因素 的 信息 隐 沽 系统 增加 了 载体 选择 的 随机 性 ,使 得 真正 区 入 消息 的 
载体 C 是 从 字符 集 Cs 中 选取 而 来 , 即 CS Cs。 同 时 ,根据 4. 2 节 的 分 析 可 知 , 假 设 隐藏 消 
县 前 后 载体 的 统计 特性 不 发 生 改 变 ,那么 完善 隐藏 模型 可 以 满足 理论 意义 的 安全 性 。 因 
此 ,完善 隐 密 通信 系统 基于 这 两 种 分 析 定 义 具体 通信 流程 。 

定义 4.3 频数 向 量 。 

频数 向 量 下 == i Ly 表示 第 i 个 载体 样本 Cs 在 实验 中 被 

定义 4.4 载体 分 布 。 


Ve ECs, PO = FON fis PC) < (4-20) 
由 载体 分 布 的 定义 可 知 


当 载体 空间 | Cs | 与 秘密 信息 空间 | M| 的 大 小 一 样 时 , 式 (4-21) 中 的 等 号 成 立 。 由 
此 说 明 ,在 实际 嵌入 过 程 中 ,载体 有 一 定 的 完 余 , 宛 余 量 大 小 为 | Cs | 一 |M]; 实际 载体 空 
间 为 |M| .嵌入 秘密 信息 的 载体 集合 为 载体 字符 集 的 子 集 ,符合 不 确定 性 安全 分 析 模型 。 


4.4.2 ”数据 预 处 理 


因为 完善 隐秘 通信 假设 通信 双方 可 通过 安全 信道 传递 秘密 信息 ,所 以 背景 知识 共享 
可 以 通过 密 钥 传递 实现 。 而 特征 和 矩阵 的 建立 主要 通过 载体 的 频数 向 量 和 分 布 实现 。 


P, 0 >= 0 0 P, 0 
0 P 0 P。 0 0 
An =|0 -e P 0| Am = 0 Pa forts 
0 0 aA 0 P. 0 
0 0 F 
0 P. 0 
Am = |0 P, … 0 


P. 0 ore 0 
模型 的 对 称 性 ;每 一 列 元 素 的 和 与 对 应 载体 的 分 布 相等 ;每 一 行 元 素 的 和 对 应 密 钥 的 分 
布 。 因 为 隐 密 通信 和 具备 一 定 的 实时 性 , 当 每 次 获取 不 同 的 通信 密 钥 时 ,通过 特征 矩阵 选取 
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的 载体 也 会 适应 性 地 发 生 改 变 。 图 4-1 显示 了 不 同 密 钥 作用 下 ,秘密 信息 与 载体 之 间 的 

从 图 4-1 可 以 看 出 ,在 不 同 密 钥 的 作用 下 ,秘密 信息 被 映射 艇 人 不 同 的 载体 中 ,从 而 
实现 载体 的 实时 性 ,保持 其 新 鲜 性 ,这 是 隐 密 通信 特征 的 重要 体现 。 数 据 预 处 理 使 得 发 送 
方 能 够 随机 选择 载体 ,而 不 是 在 同一 载体 中 的 相同 位 置 重 复 舱 入 。 当 攻击 者 根据 之 前 的 
隐秘 载体 进行 学 习 时 ,并 不 会 影响 后 续 通 信 的 安全 进行 ,体现 了 载体 选择 的 独立 性 。 同 
时 , 隐 密 通信 还 能 够 根据 载体 的 不 同 分 布 得 到 不 同 特征 矩阵 ,使 得 载体 的 选择 能 够 根据 载 
体 分 布 的 变化 以 及 载体 内 容 的 改变 而 改变 。 数 据 库 建立 操作 使 双方 通信 能 够 更 加 安全 ， 
也 是 通信 的 关键 所 在 。 


图 4-1 不 同 密 钥 情 况 下 ,秘密 信息 与 载体 之 间 的 对 应 关系 
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通信 双方 根据 已 了 解 的 数据 建立 隐 密 通信 的 特征 和 矩阵 ,并 利用 对 称 密 钥 发 送 和 提取 
秘密 信息 。 具 体 租 入 流程 可 归纳 如 下 。 
d) 发 送 方 Alice 和 接收 方 Bob 进行 隐 和 密 通 信之 前 ,双方 利用 密 钥 共享 数据 C, 通 
过 数据 预 处 理 操作 创建 特征 和 矩阵。 
(2) Alice 选取 临 时 密 铀 A. HEEL A, PA, Asc) AO 的 元 素 对 应 的 载体 c。 
A, (CRc) 尖 0 一 (人 (4-22) 
(3) Alice 选取 载体 c 中 特征 比较 明显 的 区 域 租 人 秘密 信息 ,得 到 隐 密 载体 ;。 
E,(m EM,c EC) =s (4-23) 
(4) Alice 把 获得 的 隐 密 载体 经 过 不 受 怀 疑 的 信道 发 送 给 Bob. 
Alice 通过 保持 载体 的 实时 性 ,并 在 载体 特征 明显 的 区 域 隐 藏 信息 后 ,使 得 隐 密 载体 
满足 不 可 感知 性 、 鲁 棒 性 和 安全 性 ,从 而 能 够 在 公开 信道 中 安全 地 与 Bob 进行 通信 。 
隐 和 密 通 信 的 提取 操作 是 般 入 操作 的 逆 操 作 , 主 要 流程 可 归纳 如 下 。 
(1) Bob 进行 隐秘 通信 之 前 ,利用 密 钥 共享 数据 C, 通过 数据 预 处 理 操 作 创 建 特征 
FE ME 
(2) Bob 使 用 密 钥 k 和 获取 到 的 隐 密 载体 *, ARTE RPE EE P An (hos) AO 的 对 象 抽 
取消 息 m. 
D,(A,, +s) =m (4-24) 
4-2 描述 的 是 隐 密 通信 的 整体 流程 。 
其 中 ,对 秘密 信息 的 加 密 操 作 属 于 可 选 环节 , 若 进行 加 密 , 则 接收 方 需要 进行 相应 的 
Ja 
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| 接收 方 


公共 信道 
图 4-2” 隐 密 通 信 的 整体 流程 
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jE XS 4.5 对 于 一 组 给 定 的 消息 M = {mı sla» e mi} = {Cy C2 3 "ta CL } CC Cs 
为 原始 载体 , 令 C= (01502500, },CC Cs 为 攻击 者 模仿 攻击 所 选择 的 特征 序列 。 其 中 ， 
L 为 可 能 的 候选 载体 大 小 ; :为 实际 选中 的 隐 密 载体 大 小 ,和 过 工 ; 工 一 ! 即 为 算法 提供 的 
元 余 信息 。 

在 给 定 M 的 前 提 下 ,条 件 互 信息 可 定义 为 

P(C,C | M) 
P(C | M)P(C | M) 
原始 载体 特征 与 攻击 的 特征 之 间 的 互信 息 可 定义 为 

I(C,C) = >) P(M) + I(C,C | M) (4-26) 


M cM 


I(C,C | M) = X P(C,C | M) + log (4-25) 


联合 概率 分 布 PCC,M) 可 以 用 相应 的 条 件 概率 表示 为 (cfEC) 
P(C,M) = PM) + [[ PG, | csm) (4-27) 
差异 化 函数 定义 为 
DEC 
CM P(C,M) 
假设 隐 密 算法 是 公开 的 ,对 于 合法 用 户 而 言 , 为 了 防止 秘密 信息 泄露 的 最 优 策略 是 要 
让 隐 和 密 前 后 的 载体 之 间 的 条 件 互 信息 最 大 , 即 式 (4-25) 中 的 互信 息 最 大 ,此 时 算法 提供 的 
模糊 性 最 强 。 
相反 ,对 于 攻击 者 来 说 ,破解 算法 的 最 优 策 略 是 : 尽力 搜索 到 一 个 概率 分 布 , 使 隐 密 
前 后 特征 序列 的 差异 最 小 化 ,即使 式 (4-28) 中 的 差异 化 图 数 达到 最 小 值 。 
RK (4-27) (RAK (4-28) » Wl 
D(P(C,M),P(C,M))= >\P(C,M) « lo 


(4-28) 


m P(C,M) 
P(C,M) 
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P(C,M) 
L 

P(M) » ||P; | cism) 
i=1 


= > P(C,M)log 


amt... PCCM) wy, Pleisé: smi) 
= 2 op nnns OTE - 
DPCM log pan T PCCM Dylog peony (4-29) 


为 了 分 析 方 便 , 把 CREA PIR tk A BW Bat rG) AOUR rG) =0 RAKE 
的 部 分 ,那么 式 (4-29) 可 表示 为 


D(P(C,M),P(C,M))= XPC, M) « log SCM) 


PCM) 
_ aan 1... PCCM) 
= >) P(C,M) log PMD 
| 工 
一 > P(C,M) ， logP(c; | m;) 
i=L—l 
i . : 
, P(e sê: | m) 
— P(C,M) 。 ba O 
之 2 i Plexo | m;) » PCé; | m;) 


(4-30) 

式 (4-30) 中 第 一 个 加 数 对 于 特定 的 消息 组 来 说 是 一 个 常量 ,第 二 部 分 是 宛 余 信息 ,最 

后 一 部 分 会 受到 信息 匹配 程度 的 影响 ,因此 最 小 化 差异 D 相当 于 最 大 化 公式 (4-30) 中 的 
第 三 部 分 。 


< Plecia “ie | mi) 
max( SPUC SY bpo ON i? 


i rli) £0, i=1 Plena | m;) PC; | m;). 
L l P( ~ | | ) 
= max( >, >) PM) >» Pc, sê: | m:) « log STORES 
ii t= | r(i)40,i=1 P Cen | m,) PC; | m; ) 
(4-31) 
通过 条 件 交 互 炉 简化 公式 可 得 
工 
max( b2 >) POm;) T(E sé: | m) = max(I(C;C) | (4-37) 
(ri)40,i=1 | 


从 上 述 公 式 推 导 可 知 , 对 于 合法 接收 者 ,由 于 接收 者 与 发 送 者 共享 密 钥 ,她 /他 能 够 准 
确 地 从 隐 密 信道 中 解码 出 正确 消息 。 也 就 是 说 ,在 知道 密 钥 的 情况 下 , cx 和 6 唯一 匹 
配 ,此 时 差异 化 函数 回归 常数 。 
当 工 二 1 时 ,意味 着 |M|= | 天 |=|C|。 从 攻击 者 的 角度 分 析 可 知 ,假设 采用 LSB 算 
法 实现 通信 ,攻击 者 能 够 成 功 提 取 秘 密 信 息 的 可 能 性 为 1/2。 随 着 工 的 增 大 ,攻击 者 能 够 
成 功 提取 秘密 信息 的 概率 将 呈 线 性 下 降 趋 势 ,公式 中 的 互信 息 将 越 来 越 小 ,模拟 序列 与 隐 
藏 序列 的 差异 化 越 来 越 大 ;当世 盖 ! 时 ,从 工 中 选取 ;: 项 是 通过 密 钥 进 行 挑选 的 。 攻 击 者 
首先 要 排除 元 余部 分 (L 一 7 ) 项 带 来 的 干扰 ,对 于 她 /他 而 言 , 当 密 钥 是 通过 安全 信道 传输 
时 ,系统 将 依赖 于 密 钥 的 安全 性 。 因 此 ,系统 的 安全 性 符合 Kerckhoff 的 安全 理论 : BH 
是 确保 系统 安全 性 的 唯一 关键 因素 。 
对 发 送 者 而 言 ,使 得 式 (4-30) 最 大 化 即 互信 息 最 大 是 她 /他 能 采取 的 最 佳 策 略 。 此 
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时 ,原始 序列 和 隐 密 后 的 序列 之 间 的 统计 分 布 十 分 接近 , 当 二 者 完全 相同 时 ,系统 将 达到 
理论 绝对 安全 ,如 图 4-3 所 示 。 
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图 4-3 互信 息 与 ! 及 工 之 间 的 关系 


为 了 显示 互信 息 大 小 与 消息 空间 大 小 之 间 的 关系 以 及 互信 息 大 小 与 载体 空间 大 小 之 
间 的 关系 ,实验 通过 伪 随 机 数 产 生 更 模拟 载体 的 下 , 构建 隐 密 通信 模型 。 当 载体 空间 一 
E C(L = 24), 而 消息 空间 大 小 不 确定 时 ,交互 信息 的 大 小 如 图 4-3(a) 所 示 。 当 消息 空间 
大 小 一 定 (2 = 16), 而 载体 空间 不 确定 时 ,交互 信息 的 大 小 如 图 4-3(b) 所 示 。 

从 图 4-3 中 可 以 看 出 , 当 载 体 中 隐藏 相对 于 工 越 少 的 消息 时 , 隐 密 前 后 载体 之 间 的 互 
信息 越 大 ,二 者 的 统计 特性 越 接 近 , 系 统 整体 达到 的 效果 最 佳 。 

从 图 像 的 角度 分 析 该 问题 ,将 整 幅 图 像 看 做 候选 载体 集合 ,其 空间 大 小 为 L, 通过 密 
钥 控 制 M L 中 选取 i 个 载体 作为 隐 和 密 载体 集合 进行 隐 密 。 那 么 ,对 于 攻击 者 来 说 ,她 /他 
面临 的 就 是 要 从 工 中 甄别 出 (LL 一 站 个 元 余 项 。 


4.4.5 算法 的 应 用 及 结果 分 析 


完善 隐 密 通信 模型 与 一 般 信 息 隐 藏 模型 主要 有 3 点 区 别 : 首先 ,完善 隐 密 通信 模型 
中 和 通信 载体 的 选择 是 通过 完善 隐藏 算法 生成 并 选取 的 ,而 一 般 隐 密 通 信 模 型 是 固定 通 人 
事先 获取 的 原始 载体 中 ;其 次 ,完善 隐 密 通信 模型 包含 载体 字符 集 Cs, 使 得 载体 CC Cs, 
当 使 用 不 同 密 钥 & 进 行 通信 时 , C 也 会 相应 地 变化 , 增 大 了 载体 的 随机 性 和 实时 性 。 在 经 
典 隐 藏 模型 中 , 密 钥 & 仅 作为 加 密 或 者 辞 人 密 钥 ,并 不 影 啊 载 体 的 选择 ;最 后 ,在 完善 隐 密 
通信 中 ,载体 与 秘密 信息 之 间 的 对 应 关系 是 通过 完善 隐藏 特征 矩阵 置 乱 的 ,同一 秘密 信息 
在 不 同 密 钥 的 作用 下 会 被 隐藏 到 不 同 的 载体 中 。 在 经 典 隐 藏 模型 中 ,秘密 信息 按 序 能 人 
原始 载体 中 ,并且 不 会 因为 密 钥 的 改变 而 发 生变 化 。 

4-4 显示 了 不 同 密 钥 作 用 下 ,系统 选取 进行 秘密 信息 隐藏 的 载体 的 情况 《载体 空 
间 大 小 为 24 ,秘密 信息 空间 大 小 为 16) 。 

图 中 正方 形 区 域 表 示 候 载体 集合 ,三 角形 区 域 标识 的 是 通过 密 钥 选取 的 真正 进行 消 

从 图 4-4 可 以 看 出 , 当 密 钥 发 生变 化 时 ,载体 集合 中 的 元 素 本 喘 及 载体 的 顺序 均 发 生 
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图 4-4 不 同 密 钥 作用 下 载体 位 置 的 变化 情况 


变化 ,并 且 具 有 很 少 的 重复 性 。 一 般 信息 隐藏 模型 是 在 载体 的 固定 位 置 进行 舱 入 ,因此 它 
不 具备 随 密 钥 变 化 而 变化 的 实时 性 。 

图 4-5 是 分 别 采用 隐 密 通信 方案 和 文献 [12] 的 方案 在 lena 图 像 中 进行 3 次 秘密 信息 
ik AJA HS A 


ig WEA | Be Bd 
(a) CRRI se BAR (b) 本 文 算法 能 入 信息 后 的 图 像 
图 4-5 不 同 算法 能 人 信息 效果 图 


其 中 ,秘密 信息 的 大 小 为 256 bits , 拉 伸 系数 为 0.4, 在 图 像 的 DCT 变换 域 实 现 隐藏 。 
两 幅 图 像 从 视觉 上 无 法 感知 到 太 大 的 差别 ,可 以 通过 计算 图 像 的 均 方 差 (Mean Squared 
Error,MSE ) 进 行 比较 。 计 算 公 式 如 下 。 
S Cpr; — prh) (4-33) 


M X N 0<i<N 0M 
其 中 , M 和 六 分别 指 载体 的 长 和 宽 ; pry 表示 原始 载体 的 像素 值 ; px; 表示 隐 密 后 载体 
的 像素 值 。 

还 可 以 通过 获取 峰值 信 噪 比 (Peak Signal to Noise Rate, PSNR ) 进 行 分 析 ,计算 公式 


MSE = 
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如 下 。 
PSNR = 10 X logio 


L XL 
MSE 
L 表示 载体 像素 的 最 大 灰 度 值 ,一般 采用 二 = 255, 

经 过 计算 ,图 4-5(a)  PSNR=44. 10, 图 4-5(b) 中 PSNR=64. 67。 因 此 , 当 在 同一 
载体 中 进行 多 次 重复 通 人 时 ,完善 隐 密 通信 的 效果 更 好 ,PSNR 越 大 ,失真 越 少 。 这 是 因 
为 , 当 进 行 重复 藤 入 时 ,完善 隐 和 密 通 信和 根据 每 次 的 密 钥 选择 不 同 的 位 置 钥 入 ,而 文献 [2 是 
在 固定 的 位 置 进 行 戏 人 。 当 和 通 人 位 置 比较 分 散 时 ,会 将 加 入 的 信号 量 分 散 , 而 不 是 集中 在 
一 起 ,进而 能 够 较 好 地 保持 图 像 质量 。 


(4-34) 
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水 印 


本 篇 围绕 数字 认证 和 数字 追踪 技术 ,主要 介绍 作者 在 数字 认证 和 版 权 保 
护 方 面 的 最 新 研究 成 果 。 这 部 分 内 容 主 要 集中 在 第 5 一 9 章 中 讲述 。 其 中 ,第 
5 章 详 细 论 述 数字 水 印 技术 的 相关 知识 ;第 6 章 介 绍 水 印 在 数字 多 媒体 产品 
保护 中 的 应 用 ;第 7、8 章 分 别 介绍 数字 水 印 技术 在 图 像 和 视频 方面 的 设计 方 
案 ; 第 9 章 介 绍 在 自然 语言 文本 中 的 隐藏 算法 。 


第 5 Pe 
”数字 水 印 技术 


以 数字 媒介 为 载体 的 产品 (如 数字 影院 、 图 书馆 、 音 所、 图 像 和 视频 等 ) 由 于 其 获取 容 
易 、 复 制 价 单 和 传播 迅速 等 优点 , 极 大 地 推动 了 信息 的 普及 和 交流 。 但 正如 人 和 人们 看 到 的 ， 
利用 网 络 的 开放 性 和 共 至 性 进行 的 语 如 侵犯 ,滥用 版 权 、 产 品 剩 鳃 以 及 扯 改 重 发 等 大 量 的 
恶意 行为 ,严重 损害 了 数字 产品 的 创作 者 和 使 用 者 的 正当 利益 。 因 此 ,迫切 需要 新 的 技术 
手段 保证 数字 产品 的 真实 性 和 完整 性 。 本 章 看 重 介 绍 数 字 水 印 的 相关 技术 ,后 续 章 节 再 
探索 其 在 多 媒体 产品 版 权 保护 中 的 应 用 。 
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IE ,有 关 版 权 保护 技术 已 有 很 多 成 果 , 但 大 多 数 涉及 的 是 使 用 密码 学 中 的 加 密 或 者 
其 他 基于 密码 学 的 类 似 技 术 。 对 于 今天 的 人 们 ,加密 和 解密 已 不 再 具有 神秘 性 ,已 成 为 大 
家 生活 中 经 常 使 用 的 技术 之 一 ,密码 学 是 保护 数字 产品 内 容 和 常见 的 ,也 是 发 展 得 较为 完善 
的 一 种 保密 技术 。 一 个 典型 的 例子 : 在 发 送 数字 产品 之 前 对 其 内 容 进行 加 密 , 仅 把 密 铀 
给 予 那 些 购买 了 产品 内 容 的 合法 用 户 ,但 遗憾 的 是 ,通过 加 密 并 不 能 帮助 销售 者 监视 合法 
用 户 如 何 处 理解 密 后 的 内 容 。 也 就 是 说 ,加 密 只 保护 传输 中 的 内 容 , 而 内 容 一 旦 被 解密 ， 
就 不 再 有 保护 的 作用 了 。 可 以 看 出 ,尽管 密码 学 在 保护 公共 及 个 人 信息 的 安全 方面 起 看 
草 要 的 作用 ,而 且 也 能 够 帮助 解决 数字 产品 版 权 保护 中 相关 的 一 些 问 题 ,但 在 新 的 应 用 背 
景 和 条 件 下 , 单 徘 密码 学 的 技术 是 不 够 的 。 

国内 外 许多 学 者 提出 了 一 系列 新 的 信息 安全 的 思想 ,信息 隐藏 (Information Hiding) 
便 是 当前 得 到 热烈 讨论 的 技术 之 一 ,其 基本 意思 是 ,将 一 种 信息 隐藏 于 为 一 种 信息 中 ,这 
里 所 说 的 男 一 种 信息 必须 能 够 为 每 隐藏 的 信 生 构成 一 个 足够 复杂 而 且 不 易 察觉 的 信息 环 
境 。 信 息 隐 藏 技术 涉及 的 学 科 门 类 比较 繁多 ,Petitcolas F. A. P. 等 对 该 技术 涉及 的 内 容 
进行 了 较 详细 的 概括 并 进行 了 分 类 ,如 图 5-1 所 示 。 信 息 隐 藏 其 实 是 一 门 古老 的 学 
科 , 无 论 从 其 定义 ,还 是 从 实现 原理 上 都 容易 理解 ,其 思想 可 以 追溯 到 古 硕 腊 的 隐秘 术 


) [13-15] 


(Steganography 

INF IK EN Digital Watermarking) 是 信息 隐藏 中 的 重要 技术 之 一 , 它 和 密码 学 以 及 信 
息 隐 藏 的 其 他 学 科 领 域 紧 密 相 关 ,许多 具体 技术 方法 可 以 相互 共享 ,其 定义 可 理解 为 : 不 
被 感知 的 在 数字 产品 (Digital Product) 中 上 能 入 信息 的 处 理 行为 。 数 字 水 印 技术 和 传统 的 
密码 学 方法 不 同 , 它 是 依据 信息 隐藏 的 思想 将 重要 的 、 可 认证 的 信息 散人 和 图像、 视频 、 音 频 
及 文本 文件 等 数字 多 媒体 的 内 容 中 ,成 为 难于 感知 的 部 分 ,但 表面 上 并 不 影响 产品 的 可 视 
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疗法 隐 密 


图 5-1 信息 隐藏 技术 分 类 


(可 谈 / 听 ) 性 ,而 一 旦 需要 , 则 可 以 从 加 了 水 印 的 产品 中 检测 出 预先 共和 人 的 信息 ,对 产品 的 
完整 性 以 及 版 权 进 行 认 证 和 证 明 ,以 防止 对 产品 的 自 改 和 盗版 。 和 能 人 的 水 印信 息 甚 至 还 
可 以 作为 各 种 多 媒体 播放 妖 的 有 条 件 进入 的 控制 信号 ,阻止 那些 没有 得 到 合法 授权 的 团 
体 或 个 人 对 产品 的 复制 和 滥用 ,从 而 达到 对 多 媒体 产权 的 跟踪 和 保护 ””。 所 以 , 正 是 
数字 产品 的 知识 产权 保护 及 其 他 一 系列 迫切 需求 导致 数字 水 印 诞生 ,数字 水 印 技术 已 经 
被 认为 是 解决 多 妹 体 数字 版 权 的 有 效 工 具 之 一 。 


8.2 数字 水 印 技术 的 分 关 


水 印 的 分 类 各 种 各 样 , 从 水 印 本 身 抗 信号 处 理 以 及 几何 失真 的 性 能 角度 ,可 以 将 水 印 
分 为 鲁 棒 水 印 (Robust Watermarking) #1 pë 597K ER (Fragile Watermarking); 从 所 保护 的 
多 媒体 对 象 分 类 ,也 可 以 将 水 印 分 为 语音 水 印 、 文 本 水 印 、 图 像 水 印 和 视频 水 印 等 ;其 他 分 


5.2.1 脆弱 水 印 和 和 鲁 棒 水 印 


有 关 鲁 棒 和 脆弱 的 水 印 技术 是 目前 主要 研究 的 两 类 不 同 的 水 印 技术 。 下 面 对 这 两 种 
不 同性 质 的 水 印 概念 加 以 描述 和 区 分 。 


1. 脐 弱 水 印 

脆弱 水 印 对 任意 发 生 在 宿主 信号 中 的 修改 都 具有 很 高 的 敏感 度 ,将 它 应 用 于 多 媒体 
数据 作为 一 个 整体 ,可 用 来 保护 其 完整 性 。 这 种 水 印 的 特点 是 : 在 多 媒体 中 通信 的 信息 
量 很 小 ,也 就 是 说 ,在 多 媒体 中 一 旦 存在 较 小 的 变化 ,就 足以 破坏 加 入 的 水 印信 息 ,而 通过 
对 变化 了 的 水 印 的 提取 及 分 析 , 可 对 原始 多 媒体 本 身 经 历 的 变化 进行 测定 和 评估 ,进一步 
对 多 媒体 数据 的 完整 性 .内 容 的 真实 性 等 进行 鉴定 或 认证 。 针 对 不 同 的 应 用 ,用 于 
认证 的 水 印 又 可 细 分 为 脆弱 水 印 和 半 脆 弱 (Semi-Fragile) 水 印 。 半 脆弱 水 印 主要 用 于 多 
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媒体 数据 的 内 容 认 证 。 一 方面 ,对 于 一 些 数据 人 处理 操作 ,如 轻 度 的 JPEG 压缩 等 ,多 媒体 
数据 的 内 容 并 没有 发 生 实质 性 的 改变 ,其 质量 仍 是 可 以 接受 的 ;为 一 方面 ,压缩 编码 等 操 
作 又 经 常 是 减少 数据 存储 量 和 传输 量 所 必需 的 ,因此 要 求 半 脆弱 水 印 对 可 以 接受 的 多 妈 
体 数 据 处 理 操 作 必 须 是 鲁 棒 的 ,而 对 其 他 处 理 则 能 够 进行 检测 并 加 以 区 分 ,脆弱 和 半 脆 弱 
这 两 种 水 印 的 应 用 区 别 主要 是 衡量 数字 产品 可 以 接受 变化 的 程度 。 

保护 原始 产品 的 完整 性 和 真实 性 ,从 而 不 被 其 他 非 授 权 的 机 构 或 个 人 算 改 而 挪 为 商 
业 的 非法 应 用 。 脆 弱 水 印 是 目前 解决 这 类 问题 的 有 效 手段 之 一 。 


2. 鲁 棒 水 印 

鲁 棒 水 印 根据 其 感知 性 可 以 分 为 两 类 : 可 视 水 印 汪 下 和 不 可 感知 水 印 3。 类 似 于 
传统 的 纸 质 贷 币 的 水 印 , 可 视 水 印 的 主要 目的 是 将 注册 的 版 权 明 确 化 ,防止 其 他 团体 或 个 
人 冒充 或 非法 使 用 。 比 较 常 见 的 诸如 数字 文档 上 加 载 的 半 透 明 图 标 、 商 业 广 告 以 及 电视 
台 在 它们 频道 上 播放 节目 附加 的 台 标 等 ,可 视 水 印 一 般 不 影响 数字 产品 的 视觉 效果 和 正 
常 使 用 。 可 视 水 印 的 典型 运用 是 在 IBM 数字 图 书馆 项 目 中 站 ,这 一 人 研究 成 果 已 被 美国 
国会 图 书馆 等 几 所 著名 图 书馆 采用 。 不 可 感知 水 印 一 般 指 在 多 媒体 数据 中 般 入 秘密 的 信 
息 ,而 不 造成 人 类 感觉 上 失真 的 这 种 情形 ,这 种 水 印 技术 在 保护 数字 产品 的 知识 产权 方面 
起 主要 作用 。 例 如 ,作者 版 权 遭 到 侵犯 时 ,可 以 为 第 三 方 提 供 证 据 , 告 诉 谁 是 真正 的 版 权 
所 有 者 ;打击 盗版 时 根据 盗版 媒体 提取 出 的 水 印 可 以 跟踪 非法 复制 的 用 户 和 盗版 来 源 。 
水 印 的 “和 鲁 棒 性 ?取决 于 实际 的 应 用 。 一 般 来 说 ,在 保留 数字 产品 的 使 用 价值 的 前 提 下 ,和 鲁 
棒 水 印 能 够 抵抗 一 定 程 度 的 数字 处 理 技术 ,如 有 损 压 缩 、 滤 波 、 缩 放 、. 旋 转 、 裁 剪 等 党 用 操 
作 带 来 的 破坏 。 此 外 ,和 鲁 棒 水 印 还 必须 能 够 抵制 各 种 方面 的 蓄意 攻击 。 

在 构成 多 媒体 产品 和 版权 的 永久 性 保护 方面 ,往往 需要 考虑 使 用 和 鲁 棒 性 高 的 水 印 技术 。 


5.2.2 7 EGA ERI EHH 


1. 数字 图 像 水 印 技术 

数字 图 像 水 印 是 多 媒体 水 印 的 一 个 重要 分 支 ,目前 有 关 图 像 水 印 提出 的 方案 比较 多 ， 

简单 概括 为 以 下 3 个 类 型 。 

。 基于 空间 域 的 水 印 技术 : 最 早 的 关于 图 像 水 印 的 文献 发 表 于 1993 年 ,Caronni 提 
出 了 完整 的 跟踪 图 像 非 法 传播 的 系统 "'” 。 他 建议 用 空 变 信 和 号 调制 对 图 像 进行 
标示 并 把 这 一 过 程 命 名 为 标记 (Tagging)。 同 年 , Tirkek 等 人 也 提出 了 一 些 数字 
图 像 水 印 的 方法 和 思想 -“- ,他 们 同样 强调 了 图 像 水 印 的 重要 性 并 提出 了 一 些 新 
的 应 用 ,包括 标记 、 版 权 保 护 、 图 像 数 据 的 访问 控制 .防伪 保护 等 。 将 水 印信 息 调 
制 在 图 像 像素 的 最 不 重要 比特 (LSB) 或 者 最 不 重要 的 几 个 比特 中 ,该 类 水 印 技 术 
的 缺点 是 鲁 棒 性 较 差 。 为 提高 水 印 在 空间 域 的 鲁 棱 性 ,此 后 出 现 了 一 些 更 复杂 的 
技术 。Hernandez 等 人 提出 了 一 种 深度 2D 多 脉冲 幅度 调制 的 方法 。Wolf- 
gang 等 人 把 二 维 的 m FRO A RAY LSB mg ,并 利用 互相 关 函 数 改 善 了 检 
测 过 程 。 利 用 图 像 像 素 的 统计 特性 ,一 种 方法 是 把 图 像 像 素 分 成 两 个 集合 ,通过 
修改 两 个 集合 的 均值 差 租 入 水 印 。 这 种 方法 对 JPEG 压缩 具有 较 好 的 鲁 棒 性 。 
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利用 人 类 视觉 系统 的 特性 ,Macq 等 人 提出 了 一 种 使 用 伪装 和 调制 的 水 印 方 
法 汪汪 ,使 敌人 的 水 印信 号 更 加 适应 于 载体 图 像 。Knutter 等 人 提出 一 种 更 加 复杂 
的 感知 模型 “7 ,在 分 析 人 类 视觉 系统 的 伪装 特性 以 及 水 印信 号 本 身 特 性 的 基础 
上 推导 出 一 种 优化 的 HVS 加 权 函 数 ,用 于 亮度 和 蓝 色 通道 水 印 的 舱 人 和信 。Chen 等 
人 提出 了 一 种 基于 量化 索引 调制 ,而 不 是 扩 频 调制 的 水 印 能 人 方法 ,并 宣称 其 
性 能 优 于 基于 扩 频 调制 的 水 印 方法 。 此 外 ,空域 水 印 还 可 以 通过 修改 图 像 的 几何 
特征 和 利用 分 形 图 像 编 码 实 现 … 。 为 了 抵制 几何 失真 ,Nikolaidis 等 人 提出 一 
种 空间 域 水 印 方法 所 2 ,他 们 对 图 像 中 的 重要 区 域 进 行 鲁 棒 性 的 估计 和 分 割 并 且 
在 这 些 区 域 钥 人 水 印信 息 。 


”基于 频率 域 的 水 印 技术 : 相 比 于 空间 域 的 水 印 技术 ,在 频率 域 舱 入 水 印 通常 具有 


很 多 优势 。Koch 等 人 提出 了 基于 DCT( 离 散 余 弦 变 换 ) 域 的 水 印 方法 ,通过 修改 
伪 随 机 选 定 的 中 频 系 数 对 的 差 值 符 人 水 印 5 2 。Tao 等 人 提出 一 种 自 适应 DCT 
域 的 水 印 技术 ,把 图 像 块 按照 噪声 敏感 特性 分 为 6 个 级 别 , 每 一 级 别 认 人 不 同 强 
度 的 水 印 ““ 。Cox 等 人 提出 将 水 印 能 人 图 像 中 感知 重要 的 区 域 中 ,其 思想 是 ,要 
破坏 水 印 ,必然 要 破坏 图 像 的 重要 内 容 吕 ] 。 为 了 得 到 水 印 的 鲁 棒 性 和 不 可 感知 
性 的 最 佳 折 中 ,Zeng 等 人 提出 一 种 基于 感知 模型 的 变换 域 图 像 自 适应 水 印 方案 ， 
HRA BY OL i Æ (Just Noticeable Difference. JND) Mf 7k EN R Ai A BE 
me! | Hernández 等 人 结合 视觉 模型 提出 一 种 DCT 域 盲 水 印 技 术 , 对 DCT 系 
数 统计 建 模 并 设计 了 一 种 最 大 似 然 比 水 印 检测 器 ” 。 类 似 的 水 印 技术 还 被 引入 
离散 小 波 变换 (CDWT) 域 中 。 利 用 小 波 变换 的 多 分 辩 特 性 ,能 和 的 水 印 在 不 同 分 
辩 层 上 具有 不 同 的 鲁 棒 性 和 视觉 特性 。 与 DCT 比较 ,小 波 变换 具有 更 好 的 能 量 
集中 特性 ,其 良好 的 时 - 频 分 解 特性 更 符合 人 类 视觉 系统 的 特点 ,因此 被 新 一 代 的 
压缩 标准 (如 MPEG-4 及 JPEG-2000) 所 采用 号 ] Kundur 等 人 提出 一 种 基于 多 
Ay BE ERG AO DWT dat ak Ee R884) Kia 等 人 提出 在 载体 图 像 的 每 个 分 辩 
层 上 周 人 水 印 以 及 分 层 的 检测 方法 [5 。Zhu 等 人 基于 二 维和 三 维 离散 小 波 变换 
提出 了 一 种 图 像 和 视频 水 印 的 统一 方法 "5 。Swanson 等 人 利用 时 域 小 波 变 换 并 
结合 频率 掩蔽 特性 ,提出 了 一 种 多 分 辨 视频 水 印 "“]。Barni 等 人 把 感知 模型 精确 
到 每 个 图 像 小 波 系数 “" ,从 而 最 大 程度 地 提高 了 水 印 能 量 。 还 有 一 大 类 水 印 技 
术 基 于 离散 傅 里 叶 变 换 (DFT) 域 “”"”、Radon-Wigner WUY 等 。 利 用 DEFT AY 4A 
放 和 旋转 不 变 特性 ,这 一 类 变换 域 水印 对 几何 失真 能 够 实现 较 好 的 鲁 棒 性 。 


”基于 信息 理论 的 水 印 技 术 : 一 些 学 者 利用 通信 和 信息论 的 知识 探讨 了 数字 水 印 


FS) fie A REAREA. Hernandez 等 人 从 通信 系统 的 观点 出 发 ,理论 分 析 了 在 
加 性 品 声 和 干扰、 裁剪、 线性 滤波 等 失真 情况 下 ,隐藏 信息 的 误 人 码 率 以 及 特性 变 
AE, Servetto 等 人 把 图 像 水 印 看 作 高 斯 信道 环境 中 极 低 信 噪 比 的 信号 传输 和 
检测 过 程 ,推导 了 以 噪声 方差 为 参数 的 图 像 加 性 水 印 的 容量 | Moulin 利用 香 
农 的 经 典 通信 理论 推导 了 数字 水 印 的 通用 框 以 ,分析 了 无 记忆 并 行 高 斯 模型 
下 的 水 印信 道 容 量 , 并 讨论 了 利用 边缘 通信 进行 讶 解码 的 思想 。sSu 等 人 去 掉 了 
水 印信 道 模型 中 的 无 记忆 假设 ,并 讨论 了 线性 滤波 和 加 性 噪声 下 的 最 佳 散 入 入 
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me’), Pérez-Gonzdlez 等 人 利用 香农 理论 讨论 了 信道 编码 在 水 印 中 的 作用 以 及 
水 印 的 理论 容量 。 


2. 视频 水 印 技术 

Video 由 一 系列 连续 的 以 及 时 空域 上 相关 的 静态 图 像 组 成 。 因 此 ,通常 认为 Video 
水 印 技术 与 图 像 中 的 水 印 问题 比较 相似 ,但 事实 上 图 像 水 印 技术 和 Video 水 印 技术 有 明 
显 的 不 同 。 对 于 图 像 ,可 选用 的 宿主 信号 空间 即 像素 非常 有 限 ; 对 于 Video, 可 用 信号 的 
空间 非常 大 ;视频 水 印 通 常 强 调 实 时 性 或 者 接近 于 实时 ,因此 对 于 许多 场合 ,水 印 算法 的 
复杂 性 往往 会 成 为 一 个 比较 重要 的 问题 。 男 外 一 个 需要 考虑 的 问题 是 , Video 实际 上 是 
由 相关 的 静态 图 像 序列 组 成 ,相对 于 图 像 , 增 加 了 一 些 特别 的 攻击 ,如 帧 平均 、 帧 剪裁 以 及 
帧 交换 的 可 能 性 。 下 面 简单 介绍 以 下 5 种 视频 水 印 技术 。 

。 压缩 域 和 未 压缩 域 的 水 印 方案 : 有 关 在 压缩 和 未 压缩 的 Video 序列 中 加 入 水 印 的 
方案 的 基本 原理 大 部 分 来 自 扩 频 通信 的 思想 ,其 实现 是 将 一 加 密 的 伪 随 机 信号 在 
统计 上 无 感觉 地 艇 入 Video 中 ,该 视频 水 印 方案 主要 包括 以 下 3 部 分 : 四 水 印信 
息 图 像 构 造 ,完成 对 应 每 帧 视频 图 像 的 水 印信 息 图 像 ; @ 水 印信 息 调 制 后 敌人 在 
视频 中 ; OKA APRA hell ,完成 从 视频 信息 中 分 离 水 印信 息 并 进行 信息 检 
测 ,验证 水 印信 息 的 真 伪 。 相 关 的 文献 有 F. Hartung 和 B. Girod 等 人 在 文献 
[77-79j] 中 提出 了 未 压缩 域 和 压缩 域 的 视频 水 印 ;Hsu 和 Wu 提出 了 对 于 压缩 
Video 的 水 印 ,他 们 将 图 像 的 水 印 方 案 ，… 中 扩展 到 Video 序列 中 ,该 方案 的 一 
个 缺点 是 ,对 于 水 印 的 提取 和 人 恢复 ,需要 知道 未 水 印 化 的 Video 以 及 水 印 。 
Langelaar 等 人 提出 了 对 于 压缩 Video Wy PI FPA TAN a BK ACY. Swanson 等 人 
提出 在 未 压缩 的 Video 中 的 多 级 水 印 方法 …” 。 
基于 视频 纠 错 编 码 的 水 印 方案 : Zhao 等 人 提出 的 算法 是 将 版 权 商标 通 人 在 Vid- 
eo 的 频率 域 ,空间 域 的 亮度 信息 首先 变换 到 DCT 的 频率 域 ,然后 进行 量化 *，。 
算法 使 用 密 钥 随机 地 从 量化 后 的 系数 中 选取 3 个 系数 存储 一 个 版 权 商标 的 比特 
信息 ,对 于 艇 入 1 或 者 0 ,Zhao 和 Koch 使 用 高 .中 、 低 3 种 尺度 定义 不 同 的 图 案 ， 
如 果 存 储 一 比特 的 信息 需要 在 块 的 系数 中 作 显 著 的 改变 ,就 要 对 这 些 系 数 进行 处 
理 ,形成 无 效 的 图 案 ,告诉 恢复 时 在 哪个 块 中 没有 上 般 入 信息 。 类 似 的 文献 有 Linn- 
arts 等 人 提出 在 MPEG-2 压缩 的 Video 的 GOP 结构 编码 过 程 中 敌人 信息 一- ; 
Dittmann 等 人 提出 Video 在 水 印 之 前 预先 解压 缩 ,而 在 水 印 后 再 压缩 O, 
在 连续 的 帧 中 多 次 通 人 水 印 引 和 人 宛 余 ,从 而 在 恢复 时 进行 平均。 在 MPEG-2 的 格 
式 下 ,视频 帧 可 以 3 种 不 同 的 形式 进行 编码 ,这 类 方案 中 被 租 人 的 信息 的 抗 解压 
缩 性 能 需要 考虑 i, 
基于 视频 流 运 动 差分 矢量 的 水 印 方案 : 在 MPEG 压缩 编码 算法 中 ,运动 预测 及 补 
偿 技术 通常 是 用 于 减少 帧 间 的 时 间 元 余 度 ,只 有 预测 到 有 误差 的 图 像 , 才 被 编码 。 
已 有 文章 指出 ,可 以 通过 微量 修改 运动 矢量 中 的 数据 序列 隐藏 水 印信 息 ,这 样 可 
使 水 印 的 检测 非常 容易 1 。 运 用 这 一 思想 ,该 方案 5 从 两 个 方面 改进 了 前 一 方 
案 “ ;一 是 将 水 印 舱 入 在 运动 矢量 幅 值 大 的 宏 块 中 ;二 是 在 相 角 变化 小 的 运动 矢 
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3. 


ENEP PERAKE. Æ z) e E PRAKY. WAH Ah P R A ae 2 H Ry KS 
很 多 视频 编码 中 ,如 H. 263 系列 编码 中 ,通常 采用 不 等 长 编码 (VLC) 技 术 , 根 据 
视频 中 的 运动 程度 而 采取 不 等 的 保护 ”-。 水 印 舱 入 在 运动 的 分 量 中 而 进行 编 
码 , 同 样 有 利于 对 水 印 的 保护 ;类 似 的 文献 还 有 Jordan 等 人 将 水 印 通 人 在 对 运动 
补偿 预测 的 动态 向 量 中 ,该 方案 反映 出 一 种 水 印 如 何在 视频 中 租 入 的 思想 , 那 
就 是 指 同 平坦 区 域 的 运动 向 量 可 以 伪 随 机 的 方式 做 轻微 修改 ,所 以 不 会 引入 任何 
可 视 伪 像 。 但 有 关 在 运动 向 量 中 通信 水 印 方案 的 鲁 棒 性 ,需要 在 实际 应 用 中 加 以 
空间 域 的 视频 水 印 方案 : 空间 域 视频 水 印 技术 是 指 在 视频 信息 尚 为 图 像 序 列 时 ， 
移 在 图 像 原 始 数据 空间 中 完成 水 印信 息 能 人 ,再 进行 视频 压缩 编码 过 程 的 水 印 设 
计策 略 。 这 类 设计 策略 多 来 目 较 为 成 熟 的 静止 图 像 的 水 印 技 术 , F EJK EA S R 
人 过 程 , 大 体 可 分 为 两 种 方案 : 一 种 是 利用 空间 域 图 像 特 征 , 直接 在 空间 域 完 成 
KERBRAT ROO ; 另 一 种 则 是 将 视频 的 原始 图 像 经 过 一 定 的 变换 过 程 ， 
在 变换 域 中 进行 水 印信 息 的 舱 入 ,然后 经 过 反 变 换 , 再 回 到 空间 域 的 间接 艇 入 方 
i! 。 两 者 相 比 ,第 一 种 更 直接 ,并 且 通 常 舱 入 算法 的 硬件 实现 复杂 度 较 低 ;而 
第 二 种 方案 可 以 更 充分 地 利用 人 眼 视 觉 特 性 (CHVS) 完 成 水 印信 息 的 能 人 ,如 频率 
特性 .小波 域 特性 ,使 整体 算法 鲁 棒 性 增强 ,但 实现 复杂 度 也 同时 加 大 。 

其 他 一 些 具有 特点 的 方法 : Deguillaume 等 人 提出 了 将 扩 频 的 水 印 租 入 在 Video 
的 DFT 块 的 系数 中 ” ,这 对 于 几何 变换 ,如 放大 和 位 移 没有 影响 。Kalker 等 人 
开发 了 用 于 Video 多 播 检测 应 用 的 水 印 方法 被 称 作 TAWSCJust Another Water- 
marking System), RIRA EJLA E Z H Video 帧 中 重复 舱 入 ,水 印 检测 则 
使 用 相关 检测 。 


文本 水 印 技术 


文本 作为 信息 传递 的 重要 媒体 ,其 应 用 甚至 超过 图 像 \ 语 音 等 其 他 多 媒体 形式 ,其 至 
可 以 说 无 处 不 在 。 在 人 们 的 工作 和 生活 中 扮演 重要 角色 的 文字 信息 的 传递 已 越 来 越 多 地 
依赖 于 电子 文 梢 ,特别 是 近年 来 数字 技术 的 发 展 . 电 子 出 版 物 和 电子 图 书馆 的 出 现 改 变 了 
传统 的 出 版 和 传播 观 。 作 为 以 文字 为 主 的 信息 表达 形式 ,文本 具有 其 他 媒体 不 同 的 特点 ， 
这 些 特点 决定 了 基于 文本 的 水 印 技术 和 其 他 的 图 像 .视频 等 的 明显 不 同 。 


4. 


数字 音频 水 印 技术 


和 图 像 中 的 水 印 技术 相似 ,在 音频 中 角 和 水印, 主要 是 利用 语 首 中 的 元 余 度 迄 入 水 印 
信息 。 因 为 首 频 对 噪声 的 干扰 非常 敏感 ,在 音频 中 加 入 多 余 的 信息 必然 会 影响 原始 音质 。 
因此 , 既 要 在 音频 中 加 入 像 噪声 一 样 的 水 印信 号 ,但 又 不 想 影 响 原始 的 高 保 真 度 的 音质 ， 
这 在 技术 上 是 一 个 折 中 的 选择 ;另外 ,音频 序列 可 供 利 用 的 数据 少 ,因此 不 可 能 像 图 像 和 
视频 中 那样 髋 入 太 多 的 水 印信 息 ,甚至 不 能 考虑 像 图 像 中 共和 人 多 重水 印 的 方案 ,数字 音频 
水 印 技术 也 会 是 未 来 版 权 保 护 的 一 个 重要 方面 。 


其 他 类 型 的 水 印 技 术 


除 上 述 几 种 水 印 技术 外 ,还 存在 一 些 其 他 类 型 的 水 印 技 术 , 此 处 不 再 一 一 阐述 。 
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“5.3 水 印 的 相关 研究 模型 


5.3.1 基于 一 般 通信 信道 的 水 印 模型 


研究 水 印 问题 的 一 种 思路 是 把 它 看 作 一 种 含有 隐私 的 通信 系统 ,由 于 应 用 背景 不 同 ， 
可 以 建立 各 种 形式 的 水 印 模型 。 

1. 基本 模型 

图 5-2 是 一 个 基于 基本 通信 系统 的 水 印 模型 。 水 印 的 艇 人 过 程 包含 两 个 基本 步骤: 
首先 将 信息 映射 为 附加 模板 W。, 它 和 载体 产品 c 的 类 型 一 致 ,而 且 维 数 相 同 。 例 如 , 当 
给 图 像 添 加 水 印 时 ,水印 编码 器 会 产生 一 个 二 维 的 像素 模板 ,而 给 语音 添加 水 印 时 ,水 印 
编码 器 会 产生 一 个 一 维 的 水 印信 号 ,这 类 映射 可 以 用 水 印 密 钥 实现 。 接 下 来 把 W, 加 到 
载体 产品 c。 上 , 便 产 生 了 水 印 产 品 Cy 。 


AE E 


P p di E 


水 印 密 钥 ”原始 载体 作品 原始 载体 作品 ”水印 密 铀 
图 5-2 基于 基本 通信 系统 的 水 印 模型 


2. 依赖 于 原始 载体 的 水 印 模型 

图 5-3 所 示 为 W。 依赖 于 c。 的 水 印 模型 。 它 和 图 5-2 所 示 的 模型 几乎 相同 ,唯一 的 区 
别 是 ,在 这 个 模型 中 ,水 印 编码 器 将 c, 作为 另 一 个 输入 。 这 一 改变 使 得 编码 器 可 以 赋予 
Cw 任何 值 ,只 要 W。 = Cw 一 cs。 进一步 考虑 到 载体 产品 是 传输 信道 中 噪声 过 程 Co +n) 
的 一 部 分 ,因此 这 个 新 模型 实际 上 是 发 送 端 携带 有 附加 信息 的 通信 系统 。 换 句 话 说 ,新 模 
型 中 的 认 人 亏 能 够 有 效 利 用 信道 噪声 ,尤其 是 载体 产品 cw 目 身 的 一 些 信息 。 


水 印 密 角 ”原始 载体 作品 TK EN FRA 
图 o-3 Wa ikti F co 的 水 印 模型 


3. 复 用 通信 的 水 印 模型 

两 种 信息 同步 通信 的 水 印 系 统 如 图 5-4 所 示 。 

在 图 5-4 中 把 载体 产品 当 作 和 水 印信 息 在 同一 信号 Cw 中 一 起 传输 的 另 一 信息 。 人 
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sg a a a a a pe (es i nd i 


原始 载体 作品 媒体 检测 器 


pa | 观察 的 作品 

| | | oO 
Cc Cy | J" 
信道 编码 器 | 一 一 一 名 -一 | 信道 解码 器 站 
: ”水 印 检测 器 | 

! | 给 


水 印 解码 器 


IM 


输入 的 水 印信 息 


L m m= m m m m m m e | 


水 印 密 钥 
图 5-4 两 种 信息 同步 通信 的 水 印 系统 


和 水 印 检测 需 这 两 种 完全 不 同 的 接收 需 分 别 对 co A me 这 两 种 信息 进行 检测 和 解码 。 信 
号 通过 传输 信道 后 同时 进入 人 的 感知 系统 和 水 印 监 测 硕 。 人 在 观察 Cw 时 不 会 受 水 印 的 
影 啊 , 应 该 观察 到 和 原始 载体 产品 相似 的 产品 。 水 印 监 测 副 在 检测 Cy, 时 不 会 受 原 始 载 
体 产 品 的 干扰 并 得 到 原始 水 印信 息 。 

粗略 地 讲 , 在 以 上 水 印 的 3 种 模型 中 ,第 一 种 基本 模型 直接 由 通信 模型 映射 而 来 ;第 
二 种 模型 适合 于 构造 基于 载体 特征 的 水 印 方案 , 像 用 于 版 权 保护 的 水 印 ;第 三 种 模型 对 于 
构造 可 视 的 水 印 方案 是 合适 的 。 


5.3.2 水 印 的 子 信道 分 割 模型 


下 面 以 图 像 中 的 水 印 为 对 象 , 探 讨 子 信道 水 印 的 含义 。Servetto 等 人 提出 了 一 种 水 
印 算法 ,该 算法 把 一 幅 图 像 X 分 成 互 不 重奏 的 N 个 部 分 …” 。 
Xw = [x pP r] k = 1,2, Nii 一 1,2, 50 (5-1) 
其 中 ,n 表示 每 一 部 分 的 长 度 。 这 些 部 分 可 以 是 DCT 系数 块 ,也 可 以 是 小 波 子 带 系数 的 
集合 (本 书 仅 将 DCT 系数 作为 对 象 进 行 研究 )。 同 样 ,将 水 印信 息 转 换 成 和 XO 一 样 的 
形式 。 


a a eee T BS 1 = 1 ee (5-2) 
定义 一 正 实 向 量 p”, 表示 x? WTAE AY KR WE: 
P = [py spe? ssp] k= 1,2,,N; i = 1,2,.…,n = 
则 加 入 水 印信 息 的 图 像 可 以 定义 为 
re cler tirara a wna Ta or (5-4) 
水 印 的 恢复 过 程 如 下 
W® 一 二 一 一 Bope | (5-5) 


在 以 上 的 水 印 恢复 过 程 中 ,需要 原始 的 水 印 p;” 序 列 , 通 常 被 定义 为 “ 私 钥 水 印 ” 系 
统 。 为 外 的 方案 是 在 恢复 时 不 需要 原始 水 印 序 列 , 通 党 被 定义 为 “ 公 锁 水印” 系统 。 


5.3.3 ”水 印 的 子 信道 容量 


从 广义 的 角度 讲 , 图 像 的 系数 分 块 之 间 以 及 各 个 分 块 系数 之 间 都 可 以 看 作 一 种 水 印 
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通信 的 子 信道 。 从 以 上 的 讨论 中 可 以 看 出 ,如果 将 图 像 的 特征 系数 看 成 通信 信道 的 载体 ， 

水 印信 号 看 作 实 际 上 要 传输 的 信号 ,那么 ,在 图 像 中 水 印 最 大 可 能 的 敌人 容量 也 就 是 信道 

在 有 了 噪声 的 情况 下 所 能 容忍 的 最 大 噪声 容量 。 假 设 图 像 DCT 系数 彼此 独立 ,水 印 的 系 

数 为 独立 相等 分 布 的 随机 变量 ,将 图 像 的 系数 当 作 加 性 噪声 ,由 信息 论 可 以 推 知 : 给 定 信 
We 22 Me. ST RBA RKO ,相应 的 信道 容量 为 

C= = log; (1+%) 

但 实际 的 DCT 系数 的 分 布 不 满足 高 斯 分 布 ,而 是 遵循 广义 的 零 均 值 高 斯 分 布 

\、 — alv) © alov) NE \e be. 

fæ Ca) ED xp| (一 rae | | = 

H.C) 为 伽 玛 函数 , v 与 o 是 正 实 常数 ， 分 别 控制 概率 分 布 函数 的 形状 和 变 化 。 

当 = 二 1 时 ,广义 高 斯 分 布 简化 为 拉 普 拉 斯 分 布 , v = 二 2 时 ,广义 高 斯 分 布 简化 为 高 斯 分 

布 。 有 关 这 方面 水 印 技术 的 研究 ,可 参见 文献 L96-98 | 。 


5.3.4 Watson 基于 DCT 的 视觉 模型 


有 关 在 图 像 中 求 取 最 大 艇 人 容量 (最 优 权 值 ) 的 问题 ,一 直 是 构造 鲁 棒 性 水 印 方案 的 
追求 。 但 作为 水 印 的 基本 特征 是 无 感觉 ,而 且 期 望 能 够 和 原始 载体 的 内 容 特征 相 结合 地 
芷 入 在 载体 产品 中 。 这 又 从 男 一 方面 限制 了 片面 强调 鲁 棒 性 而 忽视 人 类 感觉 效果 的 
做 法 。 

感知 模型 可 以 基于 很 多 不 同 的 信号 表示 方式 。Watson 模型 用 到 的 是 块 DCT, 也 就 
是 把 图 像 划 分 成 不 相交 的 8X8 人 像素 块 。Watson 将 模型 建立 在 块 DCT 域 上 是 为 了 将 其 
应 用 于 JPEG 图 像 压 缩 的 原理 是 将 图 像 转换 到 块 DCT 域 ,并 根据 频率 确定 步 长 对 所 得 项 
进行 量化 。Watson 模型 由 一 个 敏感 函数 、 两 个 基于 亮度 和 对 比 度 掩 蔽 部 分 以 及 一 个 合 
部 分 组 成 。 

。 敏感 度 : 该 模型 定义 了 一 个 频率 敏感 度 表 , 表 中 的 每 个 元 素 tlij] 表示 每 块 中 在 

不 存在 任何 掩蔽 噪声 的 情况 下 ,可 被 觉察 的 DCT 系数 的 最 小 幅度 ,也 就 是 产生 一 
个 单位 JND( 刚 好 能 察觉 的 差别 ) 的 系数 变化 值 ,所 以 这 个 值 越 小 ,说 明 人 有 眼 对 该 
。 Pe REHM 亮度 自 适应 是 指 ,如 果 8X8 像素 块 的 平均 亮度 较 大 ,那么 DCT 系数 
被 较 大 的 数值 修改 也 不 会 被 察觉 。 为 了 解决 这 个 问题 , Watson 模型 对 每 一 像素 
Hk k, 根据 其 DCT 项 对 敏感 度 表 中 的 tLi,jj 进行 调整 。 亮 度 掩 蔽 阔 值 
tiLisj sk] = tLisj] Cc.L0,0.k]/c.,.)°7 (5-8) 
式 中 , ar 为 一 常数 ,通常 取 值 为 0.649, c,[0,0,k] DRAB PH k HA DCT A 
数 , coo 为 原 图 像 中 DC 系数 的 平均 值 。c。。 也 可 以 设 定 为 一 个 代表 图 像 预 期 强度 
的 常数 。 从 式 (5-8) 可 以 看 出 ,在 一 幅 图 像 中 ,比较 明亮 的 区 域 可 以 在 不 被 察觉 的 
情况 下 进行 较 大 的 改动 。 
。 对 比 度 掩蔽 : Se RE E th Li.) 的 取 值 要 受到 对 比 度 掩 项 的 影响 。 对 比 度 
HE ACE ;Li,j sk] 的 计算 表达 式 为 


(5-6) 


(5-7) 
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下] 
AH, wli j] 是 一 个 0 一 1 的 常数 ,而且 会 因 频 率 系 数 的 不 同 而 不 同 。 在 Watson 
模型 中 ,所 有 ii 的 w[i, 门 都 被 取 为 0.7。 最 终 闽 值 s[i,j,k] 估计 的 是 块 DCT 
的 各 项 在 一 个 JND 范围 内 可 进行 的 变化 ,这 些 阔 值 称 为 间 阶 。 


。 合 并 : 在 对 原 图 像 < 和 失真 图 像 Cw 进行 比较 时 ,首先 要 计算 对 应 的 DCT 系数 的 


这 些 差 值 除 以 各 目的 间 际 sLi,j， 


(A eLis j k] = CwLlisjsk]— c Li jok], RF 
k], 得 到 每 一 项 的 可 感知 距离 dlisj k], 即 


atinja] = feet] 6-10 


A, dli.j.k] 是 用 JND 倍数 或 分 数 表示 的 第 & 块 中 第 (i,)) 个 频率 的 误差 。 


5.4 水 印 系统 的 一 般 性 构架 


从 信号 处 理 的 角度 看 ,对 多 尹 体 产品 的 水 印 化 可 当 作 是 类 


一 种 信号 (水 印信 息 ) 加 入 


AMMA Ss BES ROM TOE. A eS W 表示 实际 的 水 印信 号 : 


W = (wk) |wk) EU,k EW’) (5-11) 


其 中 , W 表示 维 数 d 的 水 印 领 域 ,4 一 1,2,3 分 别 表示 音频 .静止 图 像 和 视频 水 印 , 称 W 
为 “原始 水 印 ”,U 表示 水 印信 号 的 值 域 ,可 以 是 二 进 制 的 值 (U = {0,1} 或 者 极 性 符号 
U= {1,1} £00? 108) a ee ey Oy MR OT 。 在 文献 L104] 中 , Voyatzis. G 等 人 定义 了 水 印 
系统 的 一 般 性 构架 (GWF) 模 型 ,而 且 将 水 印 的 基本 构 染 用 6 个 元 素 的 一 个 组 合 XW, 
K,G, E,D) 表示 。 这 个 模型 可 以 分 成 3 个 部 分 : 水 印 创 建 \ 水 印 租 入 和 水 印 检测 ,如 
图 5-5 所 示 。 


水 印 创建 TREN A 水 印 检测 
图 5-5 GWF 模型 


X 表示 所 要 保护 的 数字 产品 X 的 集合 。 

W 表示 所 有 可 能 的 水 印信 号 的 集合 。 

K 是 ID 数 的 集合 ( 即 整数 参数 的 集合 ) ,也 称 作 水 印 的 密 钥 。 

G 表示 利用 密 钥 K 和 等 骨 入 水 印 的 数字 产品 XX 共同 生成 水 印 的 算法 


G: XXK—W W =G(X,K) (5-12) 


E 表示 将 水 印 W tA RS im Xo 的 水 印 租 入 算法 


E: XXWXK—X Xy = E(X,.W,K) (5-13) 


其 中 ,Xw 表示 能 人 水 印 后 得 到 的 数字 产品 。 
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D 表示 水 印 检测 算法 
D: XX K—{0;1} (5-14) 
1, W EW (H,) 


其 9 D(X ,W) — 4 
P 0 W ¢ W (Ho) 


Hl 和 A RIR MRR » AP Tl) Be AN K EN FF FE 
和 不 存在 。 


5.5 KINA EM im ENT 


为 了 形成 对 于 版 权 保 护 的 可 信赖 的 基础 或 者 对 于 数字 产品 的 内 容 认 证 ,水 印 应 满足 
一 些 基 本 要 求 。 
。 不 可 感知 性 : 水 印 租 入 不 能 产生 可 感知 的 数据 变化 , 即 加 水 印 的 产品 ,与 原始 
产品 和 XX, 有 具有 感知 相似 性 ,可 表示 为 XX, 一 X,。 
。 密 钥 唯一 性 : 不 同 的 密 钥 应 产生 不 等 价 的 水 印 , 即 对 任意 产品 XEX AW; = 
G(X,K;), 1 二 1,2, 满 足 Ki Æ Ks, 二 Wi 4W.. 
。 水 印 有 效 性 : 水 印 方案 中 只 采用 有 效 的 水 印 。 对 于 特定 的 产品 X CX. 4 AMY 
存在 KEK, 使 得 G(X, K) = W, WERKE W 是 有 效 的 。 
。 ART PEE: 函数 W 二 G(X, K) 是 不 可 逆 的 , 即 密 钥 天 不 能 由 函数 G BKK ED W apt 
推出 来 。 不 可 逆 性 意味 看 对 任何 水 印信 号 W, 不 可 能 找到 男 一 个 有 效 水 印 与 W 
。 产品 依赖 性 : 函数 G 利用 相同 的 密 钥 和 不 同 的 产品 作为 参数 时 ,应 该 产生 不 同 的 
水 印信 号 。 即 对 任意 密 钥 KEK 和 任意 产品 X1 ,Xs EXX, 均 满足 X 4 XW S 
W3. 
。 多 重水 印 : 通 稼 ,一 个 数字 产品 可 以 用 其 他 蜜 钥 多 次 通 人 水 印 。 这 一 特性 有 利于 
众多 分 销 商 通 人 不 同 的 标记 ,也 会 被 盗版 者 或 侵权 者 利用 。 当 Xi; = E(X;1,W;) 
时 ,对 任意 i 过 nn, 必须 满足 D(X;, WD 51, HP n OAR X, ~ X A Xe £ 


Äio 
。 可 靠 性 检验 : 肯定 检测 输出 有 一 个 可 接受 的 最 小 精度 。 用 Ps 表示 虚 警 概率 ,应 


Pn View (5-15) 
其 中 Pare HEB es AY BE E 
。 SHE: + X ERR m mM Xs。 是 其 水 印 版 本 ,满足 D(X,, WO=1. WY = 
M(X..) RY 二 M(Xo), 其 中 函数 M 表示 对 数字 产品 的 多 媒体 数据 处 理 操作 , 则 
应 该 满足 : DY,W)=1, VY ~ X, HD CY’, W)=0. 
。 计算 效率 : IKER IAE hi fe FA BK AP i He SL, 7K EN EA A) PE M E E 
以 满足 对 分 布 式 网 络 上 的 多 媒体 数据 进行 监控 和 管理 的 要 求 。 


快 ， 
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5.6 对 水 印 的 攻击 


在 开放 式 网 络 数字 产品 的 分 发 过 程 中 ,盗版 者 可 能 会 对 版 权 化 的 产品 进行 中 间 搭 线 
攻击 ,如 图 5-6 所 示 。 一 般 包括 以 下 3 种 可 能 的 情况 。 
。 非法 进入 : 盗版 者 企图 随意 删除 水 印 版 权 信息 ,在 没有 允许 的 情况 下 从 网 站 上 接 
收 数字 产品 。 
。 wee: 盗版 者 出 于 有 恶意 对 数字 产品 进行 修改 ,通过 提取 /插入 特征 对 产品 进 
行 重 发 ,原始 产品 则 丧失 了 可 认证 性 。 
© 损害 版 权 : 盗版 者 接收 到 数字 产品 ,在 没有 获得 版 权 者 许可 或 者 授权 的 情况 下 进 


行 产 品 重新 销售 。 
盗版 者 
X Pa xX’ 


图 5-6 ”水印 遭 攻 击 模 型 


下 面 列 举 了 一 些 稼 见 的 信号 处 理 操 作 和 攻击 方法 。 

d) 有 损 压 缩 : 这 是 一 类 最 篆 见 的 处 理 , 在 图 像 认 证 中 甚至 被 看 作 是 可 接受 的 失真 
处 理 。 常 见 的 有 损 压 缩 如 JPEG JPEG-2000 H. 261.H. 263、MPEG-2、MPEG-4 MPEG- 
2 audio, MPEG-4 audio,G. 723 =. 

C2) 加 性 与 乘 性 噪声 : 如 高 斯 白 噪 声 .均匀 了 噪声、 斑点 噪声 、 概 盐 噪 声 等 。 

(3) 低 通 滤波 : BARA EASTER HER. RANA PERK. MASUR. Bere 

(4) 增强 处 理 : 如 锐 化 、 印 化、 直方 图 均衡 .Gamma 校正 图像 恢 复 等 。 

(5) 几何 失真 : 包括 局 部 或 全 部 的 几何 变换 ,如 平移 .旋转 、 缩 放 、 裁 剪 、 图像 翻 转 、 行 
或 列 删除 、 尺 度 变换 。 

(6) 统计 平均 和 共 谋 攻击 (Collusion Attack): 利用 同一 幅 图 像 的 多 个 副本 ,每 个 副 
本 通信 了 不 同 的 水 印 ,可 以 通过 对 这 些 图 像 进行 平均 或 利用 每 副 图 像 的 一 小 部 分 重新 组 


合 新 图 像 去 除 水 印 。 
(7) Oracle 攻击 : 利用 公开 了 的 水 印 解 码 占 ,对 加 水 印 图 像 作 微小 修改 并 反复 进行 ， 
直到 水 印 解码 髓 无 法 检测 到 水 印 为 止 。 


(8) 多 重水 印 攻击 。 
在 实际 应 用 中 ,多 媒体 的 失真 往往 是 由 多 种 处 理 方法 产生 的 综合 失真 。 著 名 的 Stir- 
Mark- 测试 软件 可 以 提供 一 系列 的 图 像 处理 操 作 ,StirMark 还 提供 了 一 个 水 印 系 统 测 
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试 方案 ,用 于 比较 、 评 估 各 种 水 印 方案 。 


57 水 印 的 性 能 指标 评 全 


本 节 列 举 一 些 在 本 文中 将 涉及 的 几 项 常用 的 水 印 测试 指标 u。 对 于 一 个 具体 的 应 

用 ,这 些 指 标 ( 或 者 其 中 的 部 分 ) 将 能 够 对 设计 算法 以 及 水 印 化 的 效果 从 不 同 的 侧面 给 予 

(1) 无 感觉 性 (Imperceptible) : 这 是 对 水 印 算法 的 最 基本 的 要 求 。 通 人 在 多 媒体 中 

的 水 印信 号 不 能 过 分 明显 ,让 人 稍 加 注意 ,就 能 够 将 和 宿主 信号 和 水 印信 号 部 分 地 或 者 全 部 

(2) WE(E (Re HE CSignal-to-Noise Ratio): 主要 是 针对 无 感觉 性 的 一 个 具体 测试 指 

标 , 它 反映 了 水 印 作 为 “噪声 ”加 入 在 图 像 上 对 和 宿主 图 像 整 体 改 变 的 一 个 程度 , 通 篆 用 来 衡 
量 水 印 的 不 可 视 性 以 及 数据 隐藏 的 效果 。 

PSNR = 10 log (MN max 1%, />) (Inn — Inn)? ) (5-16) 


单位 为 dB, Din Imn HAY AK EA BARE. MN 分 别 表 示 图 像 的 行 
和 列 的 大 小 。 

(3) 相关 系数 (Correlation Coefficient): 用 来 测量 艇 人 的 和 提取 水 印 之 间 的 相似 性 。 
归 一 化 的 相关 系数 如 下 。 


Nw 
>) wi) WC) 
= (5-17) 


这 里 , wa) OG) TARRAA AERA K EAS. No 是 水 印 的 长 度 。 
(4) 归 一 化 的 汉 明 距离 (Normalized Hamming Distance); 如 果 水 印 由 二 进 制 的 元 素 
组 成 , 汉 明 距离 则 反映 了 两 个 相似 的 能 人 水 印 序列 和 提取 水 印 序列 之 间 的 差别 的 程度 。 


N, 
Pin (wð) = =>) wli) © AG) (5-18) 


XE, wwURN,, 和 式 (3-20) 中 的 定义 一 样 , 中 表示 异 或 操作 。 

(5) 计算 的 复杂 性 : 依赖 于 特殊 的 应 用 以 及 水 印 化 的 多 媒体 ,计算 复杂 性 是 衡量 水 
印 算法 可 行 性 的 一 个 重要 因素 。 例 如 ,在 DVD 播放 器 中 ,水 印 的 提取 有 可 能 要 求 具 有 实 
时 性 ,因此 设计 的 算法 要 在 保证 安全 的 情况 下 尽量 简单 。 对 于 静态 图 像 的 水 印 , 为 了 高 
的 、 安 全 的 .知识 产权 的 永久 保护 ,设计 的 水 印 算 法 应 尽 可 能 鲁 棒 和 复杂 ,这 不 受 实 时 性 的 
影响 。 因 此 ,对 计算 复杂 性 的 要 求 会 随 着 应 用 的 变化 而 变化 。 
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IK ENV EBS BUR AS 
产品 保护 中 的 应 用 


随 着 数字 网 络 技 术 的 完善 和 发 展 ,散布 在 网 络 上 的 多 媒 体 数字 产品 的 版 权 问 题 受 到 
了 高 度 的 重视 。 作 为 数字 产权 保护 的 应 用 技术 之 一 ,等 知识 证 明 、 公 和 钥 数字 水 印 的 基本 思 
想 是 将 密码 学 中 的 公 钥 加 /解密 的 概念 引 和 人 到 水 印 的 认证 方案 中 。 本 章 就 是 基于 密码 学 
的 一 些 协议 思想 构造 了 数字 产品 的 版 权证 明 协 议 。 


“| 。 数字 产品 的 网 络 分 发 模型 


版 权 所 有 者 用 目 己 的 私 钠 在 多 媒体 数字 产品 中 艇 入 版 权 信息 ,然后 将 水 印 化 的 产品 
在 公开 的 网 络 上 发 布 ,如 图 6-1 所 示 。 在 使 用 公 钥 水 印 “” “的 情况 下 ,任何 人 都 可 以 用 
公开 的 算法 对 水 印 进行 提取 、 认 证 ,安全 的 协议 要 保证 即使 在 诸如 Internet 这 样 的 普通 安 
全 性 的 环境 下 , 仍 能 达到 水 印 的 可 徘 认 证 。 


he 
| ee | 
| 
| \ 一 存储 备份 “一 FT 版 
| Network > al 权 
交互 认证 3 
| | p | 
| 3 | 
| a 消息 查询 ù 
| | 3 l 
| | 


身份 信息 


图 6-1 水 印 化 产品 分 发 模型 


“6.2 水印 的 创建 和 认证 


认证 模型 中 包括 一 个 安全 的 密 钥 分 发 中 心 (KDC); 一 个 可 信赖 的 版 权 管 理 机 构 
(TCM) ;产品 的 使 用 用 户 (User) 或 者 购买 者 ;版 权 所 有 者 (Owner) 或 者 也 可 以 是 被 授权 的 
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产品 的 提供 者 、 代 理 商 等 。 
。 KDC 负责 所 有 相关 密 钥 的 产生 .管理 和 分 发 。 每 个 参与 者 都 可 以 加 KDC 申请 产 
生 自 己 永 和 久 的 或 临时 的 会 话 密 钥 对 。 这 里 ,假设 密 钥 可 以 根据 各 种 要 求 安全 地 产 
。 TCM 为 可 信 的 版 权 管理 机 构 。TCM 在 自己 的 服务 右上 能 够 对 系统 内 用 户 的 产 
品 进行 注册 鉴别, 认证、 跟踪 、 管 理 等 。 在 水 印 版 权 认 证 系统 中 扮演 可 信和 的 第 三 
方 而 参与 执行 协议 。 对 所 有 参与 者 ,假设 TCM 不 泄露 有 关 各 方 的 任何 私人 的 秘 
密 信 息 。 当 发 现 有 非法 的 “假冒 伪劣 ”产品 或 者 有 欺骗 发 生 时 , 它 可 以 终止 执行 交 
互 认证 协议 、 公 告 产品 违法 等 。 同 时 ,TCM 还 是 最 终 版 权 的 终 裁 者 。 
© Owner 是 产品 的 版 权 所 有 者 /提供 者 ,Owner ACH Web 站 点 提供 目 己 的 多 媒 
体 数字 产品 。 在 这 些 产 品 中 ,Owner 通过 加 入 自己 的 秘密 水 印 而 实现 版 权 的 保 
护 , 当 发 现 自己 的 版 权 被 次 时 ,可 向 TCM 申请 进行 版 权 的 认证 和 追踪 ,同时 ， 
Owner 在 TCM 的 管理 范围 中 应 能 够 对 目 己 的 水 印 版 权 进 行 正确 的 提取 和 证 明 ，。 
User 是 多 媒体 产品 的 使 用 用 户 ,购买 产品 时 , User 可 要 求 Owner 出 示 证 明 表 明 
交易 的 产品 是 经 过 注册 的 合法 的 产品 。 同 时 ,User 有 权利 向 TCM 申请 对 所 购买 
的 数字 产品 进行 版 权 鉴定 。 对 于 TCM, User 和 Owner 享受 的 权力 待遇 应 该 
一 样 。 
基于 以 上 要 求 ,在 Owner, User Al TCM 之 间 组 成 了 一 个 简单 的 三 方 版 权 认 证 系统 ， 
如 图 6-2 Aras. 


图 6-2 基于 三 方 认证 框图 


63 水 印 版 权 的 认证 万 案 


版 权 的 认证 方案 包含 4 方面 内 容 : 版 权 认 证 系统 的 初始 化 .创建 者 版 权 的 注册 .证 明 
以 及 显示 。 

(1) 初始 化 过 程 包括 建立 一 个 KDC 以 及 TCM。 在 初步 的 协议 中 ,首先 假定 KDC 和 
TCM 是 安全 和 值得 信赖 的 ,Owner 是 真正 的 多 媒体 产品 的 创建 者 ,不 会 在 交易 过 程 中 进 
行 欺 骗 ,User 是 诚实 的 多 媒体 产品 的 使 用 用 户 。 
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(2) 注册 在 Owner 和 TCM 之 间 进 行 ,Owner 向 TCM 发 出 注册 申请 ,TCM 在 自己 
的 服务 硕 中 输入 Owner 的 注册 号 份 Id 和 数字 产品 zo ,经 过 一 番 搜 索 之 后 (这 里 的 搜索 
主要 指 对 输入 的 Td 及 z 必须 执行 两 个 子 程序 , 即 相 似 性 检验 sim2(，。) 和 相关 性 检验 
relat(。) 程 序 ) , 当 得 知 服务 器 的 存储 档案 中 至 今 还 没有 注册 过 相同 的 甚至 是 极其 类 似 
的 产品 , 则 将 Id 及 zx。 输入 构造 的 hash 函数 ,输出 一 与 Owner 的 Id 及 x。 相关 的 代表 
TCM 签名 的 确认 号 Idrcw ,将 Id、zxo、Idreu 及 相关 内 容 在 存储 器 上 建立 新 的 档案 ,注册 成 
功 ! TCM 将 以 上 结果 用 证 书 的 形式 连同 注册 时 间 发 加 Owner。 该 过 程 描述 如 下 。 


Owner: {Id, xz} 一 TCM 
TCM: sim (Id, x) = no? 


relat (Id; x) = no? 
W = regist (Id, zo >t) 
W — Owner 


(3) 产权 的 认证 涉及 User. User 得 到 数字 产品 后 , 想 知 道 自 己 买 来 的 东西 是 否 是 注 
册 过 的 正版 产品 ,最 好 的 办 法 是 上 则 TCM 求助 ,以 便 得 到 版 权 的 认证 ,TCM 验证 由 它 先 前 
签发 的 Id zm， 以 及 发 证 书 的 时 间 工 ,执行 一 验证 程序 wr (Id rem ,T), 如 果 产 品 通 不 过 ， 
此 程序 则 被 否定 。 如 果 通 过 ,TCM 则 面临 是 否 注册 过 以 及 注册 过 的 是 正版 ,还 是 蒙混 过 
Km? TCM 执行 sim(。) 和 relat(，) 程 序 , 由 prov(。，。) 的 结果 断定 产品 是 否 正 版 。 
在 这 一 过 程 中 ,sim(。，) 和 relat(，。) 程 序 的 结果 必须 同时 得 到 满足 。 描 述 过 程 如 下 。 


User : z, — TCM 
TCM : ver (Idem, D) =S true ? 
sim( Zw) — ok? 


relat(z,) = ok? 


prov( I dd Tem Tm ) = ok? 


(4) 在 步骤 (3) 中 ,TCM 只 能 回 User 肯定 发 送 来 的 数字 产品 已 经 进行 了 产权 注册 ， 
但 它 并 不 能 告诉 User 原始 产品 的 提供 者 是 否 在 产品 中 租 人 了 水 印 以 及 用 什么 方式 或 者 
KAKER RAE. Ær). KE, TCM 可 要 求 Owner 进一步 协助 证 明 x 的 确 
是 Owner 自己 水 印 化 的 产品 。 由 Owner 提供 水 印 的 租 入 公 和 钥 有 ,TCM 根据 租 入 算法 
emb(，。) 计 算 . 
Owner: {downers Rp sken 一 TCM 


TCM : hash (Ido. > #p) > W 
emb(z, W Rams ) —— w 


(ro =T) == true! 


(5) 进一步 ,如 果 有 版 权 纠 纷 问 题 ,作为 真正 的 版 权 拥 有 者 ,只 有 Owner 才能 提供 正 

确 的 水 印 ,但 有 时 有 多 个 Owner 同时 声明 对 产品 拥有 所 有 权 , 这 就 引起 了 产权 纠纷 问题 ， 

在 很 多 密码 学 中 ,解决 这 类 问题 的 一 种 方法 是 验证 签名 的 时 标 , 但 在 水 印 版 权 方面 ,这 种 

方法 需要 进一步 研究 。 例 如 ,同样 是 信息 的 艇 入 ,为 什么 攻击 者 不 可 以 变动 目 己 的 时 标 信 
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FA? 不 过 ,我 们 的 方案 还 是 将 版 权 的 注册 和 取得 的 证 书 、 执 行 的 时 间 相 连 。 这 样 , 即 使 攻 
击 者 能 够 在 舱 入 信息 中 自 改 时 标 , 但 它 能 否 经 过 认证 , 则 需要 有 关 的 证 据 文 持 。 


Owner: alg orithm (£us karaa) > W +x0 


prov (W’=W)== yes ! 


prov Cx = Zo) 一 一 yes | 


hash ' ( Idcm sks» H) = I downer 


C6) 如 果 发 生 所 谓 的 版 权 纠 纷 ,最 终 的 解释 就 需要 真正 的 政府 法 律 机 构 的 仲裁 。 


OBa ”数字 水 印 的 认证 协议 


6.4.1 相关 认证 协议 


1. TCM 的 初始 化 协议 
基于 Schnorr 身份 识别 方案 中 ,在 TCM 建立 初始 化 的 协议 ,该 协议 主要 涉及 对 产 
品 版 权 的 正常 注册 以 及 认证 的 初始 化 过 程 , 具 体 如 下 。 


1. 令 pp 是 一 个 大 素数 ,使 得 Zr ”的 离散 对 数 问题 是 最 难 解 的 。 
. 9 是 一 个 p 一 1 的 大 的 素 因 子 。 
3. a EZp*# 有 阶 g (这 样 ,一 个 a 能 从 本 原 元 的 (p 一 1)/g KEEPS). 
. TCM 还 建立 一 个 安全 参数 7 ,满足 g 三 2”，。 
.TCM 规定 一 个 安全 的 水 印 注册 方案 ,该 方案 具有 一 个 秘密 的 注册 算法 regist) 和 一 个 公 
开 的 验证 算法 ver (+). 
6. TCM 规定 一 个 安全 的 散 列 函数 hash (+), 所 有 信息 在 注册 前 要 进行 散 列 。 
7. 参数 poqa 以 及 验证 算法 ver (+) 和 函数 hash) 全 部 公开 。 
r 是 一 个 安全 参数 ,如果 随机 选择 7r, 冒充 者 就 会 猜测 出 正确 的 7r 值 的 概率 为 2 ,>r 值 的 选择 取 
决 于 系统 的 安全 要 求 。 


2. 产品 的 注册 

注册 在 TCM 和 Owner 之 间 进 行 ,Owner 将 目 己 的 版 权 信息 进行 加 密 , 并 且 将 加 密 
结果 发 向 TCM,TCM 对 来 自 Owner 的 申请 进行 注册 ,然后 将 注册 证 书 发 向 Owner, 
Owner 将 发 来 的 注册 过 的 证 书 当 作 原 始 的 水 印信 息 经 过 hash(，) 函 数 计算 后 将 结果 说 
人 目 己 的 多 媒体 产品 中 。 


. Owner 秘密 地 选择 一 个 随机 指数 ac,0 志 ai 过 gg 一 1, 并 计算 v=o mod p, Hi v4 TCM. 
Ln TCM 产生 一 个 注册 证 书 z Id tcm = regist (Id owner + UV) 


3. TCM 将 证 书 Id rcm Fe (al Owner, 
. Owner ii — lA i PR AS BA EY RAE E P ZK ED W = hash Cazo, Id +k, +t). 
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3. 水 印信 息 的 显示 及 证 明 

该 协议 在 Owner 和 User 之 间 进 行 。 作 为 正 篆 的 用 户 ,User 有 理由 在 购买 产品 时 ， 
向 Owner 提出 要 求 出 示 合 法 的 版 权证 明 她 /他 出 售 的 产品 的 合法 身份 ,因此 ,在 二 者 之 间 
形成 一 个 秘密 版 权 的 证 明 交 换 协 议 。 当 然 ,这 个 过 程 可 以 在 TCM 的 参与 下 进行 ,也 可 以 
在 TCM 不 参与 的 情况 下 而 有 事先 的 授权 ,如 果 有 必要 ,User 可 以 将 Owner 发 回 她 /他 的 
信息 发 向 TCM 进行 进一步 的 原始 认证 ,Owner 也 可 以 向 TCM 要 求 对 Owner 的 合法 性 
进行 评估 。 


. Owner 选择 一 个 随机 数 1, 0 三 7 三 q—1, 并 计算 y= a mod p, 
. Owner RIK (Id oun, +s) 和 YY 给 User. 
. Owner 通过 检查 wrCldrmsvss) =true 验证 TCM 的 签名 。 


. User 选择 一 个 随机 数 7,1 过 rr 过 2 且 把 它 送 给 Owner。 
. Owner 计算 :y= (十 ar) mod q HHE y KA User, 
j. User 验证 y = a” v (mod p). 


6.4.2 协议 的 安全 性 分 析 


基于 Schnorr 身份 认证 方案 的 安全 性 建立 在 计算 离散 对 数 的 难题 上 ,作为 密码 学 上 
的 身份 认证 协议 , 它 是 可 靠 和 完备 的 ,将 其 用 于 公开 网 上 水 印 的 版 权 认 证 系统 中 ,避免 了 
在 使 用 私 钥 水 印 系统 中 必须 传递 密 钥 或 使 用 原始 数据 才能 进行 水 印 检测 和 认证 的 缺点 。 

(1) 模仿 攻击 :就 像 上 面 协议 提 到 的 ,在 安全 参数 r 确定 的 情况 下 ,如果 Owner 随机 
地 选择 上 ,冒充 Owner 欺骗 User 的 成 功 概 率 就 为 2“。 实 际 使 用 中 ,协议 的 每 一 次 迭代 都 
规定 在 一 多 项 式 时 间 内 完成 。 这 样 ,根据 具体 的 计算 效率 , t 的 选择 不 一 定 需 要 很 大 。 

(2) 水 印 算 法 及 验证 算法 是 公开 的 ,但 是 算法 每 次 迭代 的 某 些 临 时 参数 不 同 ,这 样 可 
保证 信息 交换 的 新 人 鲜 性 ,而 防止 在 交互 认证 中 出 现 重复 性 的 攻击 现象 ,协议 中 的 算法 理论 
上 都 是 不 可 道 的 。 

(3) 阻止 合法 产品 被 非法 重新 分 发 :如 果 偷 写 者 能 够 以 “合法 ”的 号 份 伪 造 Owner 的 
产品 在 网 络 上 出 于 私有 利益 进行 重 发 销售 ,Owner 可 向 TCM, 甚 至 向 法 庭 提 出 诉讼 ,在 
公证 机 构 的 监视 下 ,Owner 用 能 人 密 钥 揭示 出 自己 注册 的 原始 水 印 ( 合 法 的 Id 或 者 商 
标 ), 从 而 证 明 她 /他 是 原始 产品 的 版 权 拥 有 者 。 

(4) 在 整个 结构 中 ,我 们 始终 认为 TCM 是 诚实 和 可 靠 的 ,如 果 TCM 不 可 信 , 甚 至 
TCM 还 有 可 能 和 其 他 用 户 以 及 创建 者 的 一 方 共 谋 欺 骗 男 一 方 。 同 样 的 不 可 信赖 性 也 可 
能 发 生 在 KDC 的 管理 上 。 对 于 这 些 问题 ,本 书 没有 进行 深入 讨论 ,文献 [L112] 有 所 提 及 。 
王 彩 纷 教授 在 其 博士 论文 “ 有 关 和 密码 学 中 的 基于 不 可 信和 和 半 可 信和 的 总 裁 机 构 的 协议 的 安 
全 性 研究 ”中 对 这 一 问题 进行 了 详细 讨论 。 

(5) 整个 认证 协议 对 网 络 的 安全 性 要 求 较 低 。 


6.4.3 ” 公 和 钥 水印 产权 的 检测 和 跟 踊 
(1) 作为 公 钥 水 印 在 产品 中 的 嵌入 ,任何 合法 的 消费 者 或 机 构 都 可 以 通过 公开 的 验 
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证 算法 对 数字 产品 的 版 权 加 以 认证 ,这 在 一 定 程度 上 能 够 抑制 网 络 上 无 注册 的 非法 产品 
的 传播 ;为 一 方面 ,也 能 保证 消费 者 个 人 应 有 的 合法 权利 和 利益 。 

(2) 交互 式 认证 协议 使 得 盗版 者 对 原始 的 水 印 化 产品 的 重 发 或 者 “倒卖 ” 变 得 困难 。 
因为 购买 者 可 通过 版 权 管理 机 构 的 “帮助 ?认证 销售 者 的 版 权 以 及 合法 注册 喘 份 ,如 果 二 
者 不 符 , 则 交易 被 终止 。 从 这 一 点 上 讲 ,尽管 交互 式 认证 协议 似乎 和 水 印 本 号 的 技术 没有 
非常 紧密 的 关系 ,但 作为 水 印 的 实际 应 用 , 则 是 不 可 缺少 的 ,也 是 水 印 技术 的 一 个 重要 
部 分 。 

C3) 对 原始 水 印 化 产品 的 修改 或 改变 , 则 通过 对 产品 中 和 通 人 “证书 ”信息 的 检测 得 到 
估计, 产品 在 茶 个 中 间 环 节 被 修改 ,有 可 能 被 比较 明显 地 显示 出 来 ,或 者 尽管 没有 明显 的 
修改 并 迹 ,但 租 入 其 中 的 版 权 数 据 有 一 定 的 变化 (脆弱 水 印 ) ,这 一 点 可 能 更 符合 对 脆弱 水 
印 特征 的 定义 。 作 为 TCM 的 服务 第 可 以 对 这 种 修改 进行 检测 、 佑 计 , 针 对 不 同 的 情况 进 
行 处 理 。 

(4) 基于 公 钥 水 印 的 认证 ,避免 了 在 信道 上 传递 大 量 的 有 关 原 始 产 品 的 数据 ( 私 钥 水 
印 ), 对 于 信道 上 的 丛 听 者 , 想 获得 对 产品 中 水 印 的 攻击 所 需 的 信息 是 困难 的 ,或 者 说 她 / 
他 可 能 需要 付出 更 大 的 代价 。 这 样 ,在 公开 网 上 有 利于 对 数字 版 权 的 保护 。 


“6.5 ”基于 零 知 识 证 了 明 的 水 印 认证 协议 


为 了 阻止 对 产品 中 版 权 的 攻击 ,版 权 所 有 者 不 期 望 在 公开 的 版 权 认 证 过 程 中 泄露 太 
多 的 原始 水 印 ( 版 权 ) 信 息 , 而 且 有 必要 将 它 视 为 只 有 上 自己 知道 的 秘密 。 但 作为 数字 产品 
要 公开 的 销售 ,他 又 不 得 不 同 其 他 人 揭露 足够 的 信息 ,使 别人 相信 产品 是 他 目 己 创作 的 ， 
或 者 说 ,他 具有 产品 独一无二 的 知识 产权 。 改 一 方面 ,购买 者 在 购买 产品 时 ,也 可 能 对 产 
名 的 合法 性 进行 怀疑 ,和 希望 能 够 揭示 足够 的 信息 证 明 产 品 来 和 目 合 法 的 作者 或 者 合法 的 软 
件 公司 。 

零 知 识 证 明 的 本 质 是 人 们 可 以 证 明 一 个 事实 的 知识 ,而 对 其 他 人 不 泄露 该 知识 的 一 
种 方法 。 零 知识 证 明 协 议 的 特性 可 以 很 好 地 应 用 于 水 印 的 认证 系统 ,以 解决 上 述 数 
字 版 权 认 证 中 的 问题 。 


6.5.1 基于 离散 对 数 的 零 知 识 证 明 协 议 


选择 公开 的 大 素数 p 和 生成 元 q ,以 9g 为 基 进 行 mod pp 计算 :M = g (mod p) ,公布 
M 而 保持 xz 为 秘密 ,显然 ,给 定 M 确定 x JEKE., Owner 通过 证 明 z 的 知识 确认 目 己 的 
号 份 。 

(1) Owner 产生 随机 数 vy, 计算 NN = g (mod pp), 将 NN KI] User. 

(2) User 知道 M 和 NN ,依赖 于 投 人 硬币 的 结果 要 求 Owner 

要 么 给 出 y, 验 证 N = q’(mod p). 

要 么 给 出 y 十 XC(mod(p 一 1)), 验 证 MN 一 g’ tX mod ph 

(3) Owner 完成 以 上 步骤 之 一 。 
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(4) 数据 y、N 被 丢弃 。 在 协议 的 每 次 迭代 中 ,都 产生 新 的 数 。 

在 上 面 的 协议 中 ,Owner 每 次 欺骗 User 的 概率 为 /2。 对 协议 迭代 次 ,欺骗 的 概 
率 就 为 1/2“。 实 际 中 ,协议 的 执行 可 能 要 求 在 一 定时 间 内 完成 ,因此 n 的 值 不 一 定 
很 大 。 


6.5.2 零 知 识 证 明 协 议 在 水 印 认 证 中 的 应 用 


以 上 协议 中 ,如 果 Owner 不 知道 有 关 x 的 知识 ,就 无 法 满足 (2) 中 的 后 一 个 要 求 , 在 
证 明 目 己 的 确 知 道 x 时 ,使 用 和 秘密 隐蔽 特性。 协议 中 ,将 对 M 对 数 的 计算 问题 转化 
为 对 MN 的 证 明 , 其 目的 是 通过 证 明 相 关 的 一 个 问题 使 男 外 的 人 知道 原始 问题 的 答案 。 
男 一 个 要 说 明 的 是 ,该 协议 是 问答 式 认证 协议 ,需要 通过 “隐蔽 ”完成 。 问 容 式 协议 保证 诚 
实 的 一 方 证 明 者 被 要 求 揭示 足够 的 信息 限制 欺骗 的 概率 。 在 隐蔽 的 情况 下 ,证 明 者 要 人 么 
解决 转换 的 问题 ,要 人 么 证 明 对 事实 的 隐蔽 是 完全 清楚 的 , 即 转换 的 问题 是 从 原始 问题 中 推 
导 而 来 。 零 知识 证 明 协 议 也 可 以 构造 成 非 交 互 式 的 形式 ,也 就 是 将 所 有 需要 多 次 提 
问 的 问题 一 次 性 回答 完毕 。 

零 知 识 证 明 协 议 的 特性 决定 了 它 在 公 钥 水 印 认 证 中 的 应 用 542529 ,文献 [112] 中 给 
出 了 基于 图 同 构 的 零 知 识 证 明 构 成 的 图 像 签 名 系统 ,这 里 假设 Owner 在 一 个 Web 站 点 
具有 在 认证 中 使 用 的 一 些 数 据 , 但 最 终 这 些 数据 都 要 被 和 散人 要 提供 的 多 媒体 中 作为 
Owner 版 权 的 声明 。 如 果 这 些 般 入 的 数据 信息 在 认证 过 程 中 被 知道 ,那么 攻击 者 就 可 以 
充分 利用 这 一 点 ,如 假扮 Owner 而 非法 地 重新 销售 Owner 的 多 媒体 产品 等 。 男 一 方面 ， 
对 于 诚实 的 购买 者 ,Owner 要 能 够 揭示 目 己 艇 入 的 版 权 信 息 证 明 目 己 是 产品 的 合法 版 权 
所 有 者 。 因 此 ,需要 Owner 和 通 人 的 版 权 信 息 既 能 公开 被 认证 ,同时 又 保留 原始 的 版 权 信 
县 使 用 零 知 识 证 明 协 议 对 水 印信 息 的 认证 ,能 使 磐 人 的 版 权 信息 充分 被 其 他 人 证 明 ,但 本 
身 足 够 隐 密 。 想 获取 有 关 它 的 信息 非常 困难 。 

6.5.3 零 知 识 证 明 协 议 下 水 印 的 创建 

Owner 首先 将 目 己 的 数字 产品 工 和 身份 信息 Id ower Hh] TCM 注册 ,TCM 经 过 一 番 检 
验 后 ,认定 了 和 IT4dowmo 属 于 合法 , 则 产生 一 相关 的 由 TCM 签名 的 鉴定 信息 。 这 里 假设 
TCM 的 信息 可 被 表示 成 模 p 上 的 一 个 整数 A ,TCM 将 目 己 的 鉴定 信息 用 证 书 dieu 的 
形式 连同 注册 时 标 发 回 Owner, 即 

Owner: {I,Idoume } ~ TCM 
TCM: Idem = Signiam{I,I downer } 
{Idiem T} 一 Owner 
(1) Owner 在 获得 的 证 书 中 得 到 A,A REE A Wi A AY 7K Ei A J aa m a 中 ,同时 A 
也 可 表示 成 一 长 度 为 N,mod p 上 的 二 进 制 序列 A。 定 义 : 
A = {a 0< i< N} a; € {0,1} 
(2) Owner 选择 素数 p、g, 用 基 q, mod p 的 离散 对 数 对 和 能 人 的 信息 进行 计算 , 即 
m = (mod p) 
公开 m 以 及 保持 A 为 秘密 。 
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(3) Owner 同时 产生 另外 的 ;一 1 个 小 于 p 一 1 的 随机 数 B,(1 达 i 三 1 一 1), 分 别 计算 
m; = q* (mod p— 1) 
表面 上 看 ,这 1t 一 1 个 mi 与 m 没有 任何 差异 ,似乎 都 是 等 长 为 NN 的 二 进 制 序列 。m 
和 m; 共 组 成 了 zt 个 元 素 的 集合 名 二 《mymz ssm- 5m}. Kw PH IR m 以 及 m 的 先 
后 顺序 随机 地 置 乱 ,然后 串 接 起 来 ,可 形成 长 度 为 NX ¢ 的 二 进 制 比 特 串 , 仍 记 为 w。 
(4) Owner 用 序列 w 乘 以 系数 a;(a; 宇 0) (a 是 一 控制 振幅 强度 的 常数 ) SAKE tk 
人 原始 产品 z 的 信息 码 流 中 : zx; 二 r Haw. 


6.5.4 ” 零 知 识 证 明 协 议 下 水 印 的 认证 


任何 时 候 ,Owner 都 能 够 揭示 构造 的 认证 水 印 的 集合 信息 以 及 证 明和 集 合 中 每 个 元 素 
的 检测 值 ,但 Owner 必须 证 明 至 少 有 一 个 水 印 是 合法 的 。 假 如 Owner 和 User 选择 在 I 
中 通过 检测 器 成 功 发 现 的 水 印信 息 w o AWEN FE” 。 

(1) User 和 Owner 参与 便 币 抛 撕 协 议 , 以 产生 t 个 位 2;。 

(2) 对 所 有 t 个 位 ,Owner 完成 下 列 两 种 情况 中 的 一 种 : 

如 果 65; 二 0, 则 将 B; AIK [a] User. 

如 果 5; 二 1, 则 将 S;= (B;+B;) mod (p—-1) Æi] User. HP j 是 2 三 1 的 最 
小 值 。 

(3) 对 所 有 t 个 位 ,User 证 明 下 列 两 种 情况 中 的 一 种 : 

如 果 6,=0,.88 A a: = m;(mod p). 

如 果 b51, HRA aX = m;m,;(mod p). 

(4) Owner 将 z Aik fe] User: 

z = (A+B;) mod ( p— 1) 
(5) User 进一步 证 明 : 
a* = mm,(mod p) 


如 果 Owner 在 每 一 步 中 都 能 完成 证 明 , 则 User 相信 Owner 的 身份 。 
6.5.5 对 协议 的 补充 说 明 


(1) 在 零 知 识 水 印 认 证 协议 中 , User 只 是 对 版 权 进 行 了 认证 , 而 始终 没有 获得 秘密 
身份 ,这 一 “ 零 知 识 ? 对 于 用 户 究竟 是 什么 ? 事实 上 ， 零 知识 ?是 指 注 册 的 版 权 信息 ,由 公 
认 的 版 权 中 心 TCM 授权 ， 具 有 可 信 性 。TCM 保证 对 用 户 做 诚实 承诺 。 为 了 防止 
Owner 在 产品 中 峙 人 伪造 的 版 权 信息 ,TCM 可 对 注册 的 产品 及 产权 者 的 身份 进行 检测 。 
另 一 方面 ,User 可 能 要 求 对 产品 的 身份 进行 验证 ,将 检测 到 的 w 提交 给 TCM, TCM 计 
算 m= gq, 并 检验 mE w ,这 一 点 证 明了 Owner 的 确 没 有 用 假 身 份 替换 真实 的 注册 身份 
A RAKE., TCM 将 结果 以 “是 ”或 “ 否 ” 的 形式 回答 User。 除 此 之 外 ,不 回答 User 任何 
询问 。 

(2) Owner 在 每 次 认证 中 ,需要 重新 产生 一 组 随机 数 B;, 而 原来 的 数 被 丢弃 。 在 实 
际 水 印 的 创建 中 ,由 于 这 些 数 对 应 的 离散 对 数 和 m 组 成 的 w” 需要 做 人 数字 产品 中 ,也 就 
是 用 于 舱 入 水 印 的 集合 是 变化 的 ,但 其 中 存在 的 一 个 问题 是 ,m 始终 是 不 变 的 ,这 样 就 给 
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攻击 者 留 有 机 会 ,因为 他 可 以 进行 多 次 认证 。 从 提取 的 众多 水 印 中 对 比 得 到 m, 尽 管 
不 能 得 到 原始 的 版 权 信息 A, 但 攻击 者 一 旦 知道 m, 他 就 可 以 用 一 伪造 的 版 权 A’ 计 算 


m = q” ,连同 一 系列 随机 数 , 作 为 水 印 能 入 产品 进行 产品 的 重 发 。 对 该 问题 的 解决 有 赖 


于 Owner 对 水 印 集合 的 构造 。 在 每 次 认证 中 ,Owner 选取 1 一 1 个 元 素 连 同 m FY MK A 
的 水 印 , 与 前 面 不 同 的 是 ,每 次 选取 的 t 个 元 素 中 除了 m, 有 一 部 分 可 以 和 上 一 次 的 重复 ， 
这 样 的 结果 使 得 攻击 者 在 w 中 无 法 挑选 出 真正 的 m, 这 是 一 个 统计 概率 。t 的 选取 以 及 
重复 元 素 的 个 数 有 赖 于 系统 对 安全 的 要 求 。 

(3) 在 零 知识 水 印 认证 协议 中 ,为 了 解决 来 日 Owner 以 及 User 的 欺骗 ,引入 了 第 三 
方 TCM,TCM 是 可 信 的 权威 机 构 , 所 有 在 Network 上 交易 的 数字 产品 以 及 水 印 都 应 是 
在 授权 范围 内 注册 过 的 。 为 了 防止 Owner 以 假冒 身份 进行 网 上 销售 或 者 销售 假冒 产品 ， 
TCM 有 权时 刻 对 网 上 的 产品 水 印 进行 检测 及 跟 踊 。 男 一 方面 ,TCM 甚至 可 对 购买 者 
User 的 号 份 进行 评估 。 对 于 TCM 是 半 可 信 的 或 者 不 可 信 的 情况 ,需要 在 协议 中 增加 位 
承 旋 、 羊 签名 等 辅助 协议 补充 完成 。 


656 ”基于 图 同 构 的 零 知 识 证 明 在 水 印 认 证 中 的 应 用 


文献 L112 中 提出 了 一 个 对 图 同 构 的 完全 零 知识 交互 式 证 明 系 统 ,具体 如 下 。 

假设 图 GA G, 都 有 定点 集 {1, 2,…, 2)} ,对 图 的 非 同 构 的 交互 式 证 明 如 下 所 述 。 

(1) HE FAR n 次 。 

(2) 询问 者 选择 一 个 {1,，2,…, n) 的 随机 置换 ,在 置换 x 下 计算 图 GRH ,并 发 
KH 给 询问 者 。 

© 询问 者 选择 一 个 随机 整数 i = 1 或 2, 并 把 它 发 送 给 应 答 者 。 

应 答 者 计算 一 个 {1 ,2,…, n) 的 置换 p WEE p FH 是 G; 的 像 。 应 答 者 发 送 o 
A al ae UR i = 1 ,那么 应 答 者 定义 o 三 as WRI = 2 ,那么 应 答 者 定义 0 为 o 和 7 的 
合成 。 这 里 ,o 是 某 一 固定 置换 ,在 c 下 G; 的 像 是 G). 

(3) 询问 者 检查 在 p FH 是 否 是 G; 的 像 。 

(4) MRE n EHEH H 是 G,; 的 像 , 那 么 询问 者 接受 应 答 者 的 证 明 。 

注意 : 该 证 明 系 统 是 完备 和 可 靠 的 。 很 容易 看 到 ,如 果 G 与 G 同 构 ,那么 询问 者 接 
受 的 概率 为 1。 如果 G 与 G: 不 同 构 ,那么 应 答 者 欺骗 询问 者 的 唯一 方法 是 他 /她 正确 地 
猜 出 询问 者 在 每 轮 中 将 选择 的 值 i ,并 且 在 通信 带 上 写 上 G; 的 一 个 随机 同 构 副 本 。 正 确 
猜 出 询问 者 的 n 个 随机 询问 的 概率 是 2“。 
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本 草 提 出 了 模糊 烂 测度 算法 (FEMA) 检 测 图 像 中 适合 信息 隐藏 的 显著 的 特征 区 域 ， 
然后 将 水 印 租 入 在 这 些 区 域 的 DCT 系数 中 ,以 获得 更 高 的 鲁 棒 性 ;基于 混沌 映射 将 商标 
图 像 的 像素 在 空间 域 中 进行 置 乱 ,这 个 过 程 相 当 于 形成 了 用 户 的 密 钥 ,也 使 置 乱 的 商标 信 
县 分 布 随机 化 ;提出 了 目 适 应 于 图 像 内 容 特 征 的 水 印 通 入 算法 ,避免 了 水 印 化 图 像 在 平坦 
区 域 的 失真 ;提出 了 利用 Kalman 滤波 的 方法 对 舱 入 的 水 印 进行 盲 检测 ,商标 能 够 在 随后 
的 检测 以 及 重 构 中 得 到 可 徘 的 恢复 ,以 表明 数字 产品 的 版 权 。 


7.1 图 像 讨 缩 


数字 图 像 中 各 个 像素 之 间 都 具有 很 大 的 相关 性 ,这 种 相关 性 造成 图 像 信 息 的 元 余 , 如 
空间 元 余 . 频 域 空 间 元 余 或 者 时 间 域 元 余 。 空 间 元 余 是 因为 相 邻 的 灰 度 像素 分 布 具有 很 
强 的 相关 性 ; 频 域 空 间 元 余 的 出 现 是 因为 在 多 谱 段 图 像 中 ,不 同 谱 段 的 图 像 对 应 的 像素 之 
间 具 有 很 强 的 灰 度 相关 性 ;而 时 间 域 元 余 则 是 因为 对 连续 的 图 像 而 言 , 相 近 两 帧 之 间 的 像 
素 灰 度 同 样 具 有 很 强 的 相关 人性。 

数字 图 像 中 的 像素 灰 度 并 不 是 均匀 出 现 的 ,如 果 每 个 像 泰 灰 度 都 用 同样 的 长 度 表示 ， 
就 会 出 现 匈 余 , 即 图 像 的 信息 炉 元 余 。 此 时 如 果 把 出 现 次 数 比 较 多 的 灰 度 值 用 一 个 比较 
短 的 编码 表示 ,而 出 现 次 数 比 较 少 的 灰 度 值 用 一 个 相对 而 言 长 度 较 长 的 编码 表示 ,也 有 可 
能 使 得 整个 图 像 的 编码 总 长 度 变 短 。 

数字 图 像 能 量 在 频 域 的 分 布 同样 也 是 不 均匀 的 。 图 像 变 换 到 频 域 后 ,大 部 分 能 量 集 
中 在 频率 比较 低 的 部 分 ,中 频 和 高 频 的 部 分 能 量 与 低频 部 分 相 比 较 少 。 根 据 这 一 特点 ,可 
以 先 把 图 像 变换 到 频 域 ,对 变换 得 到 的 频 域 信号 进行 处 理 , 能 量 较 小 的 高 频 分 量 用 较 短 的 
编码 表示 ,而 能 量 较 大 的 低频 分 量 用 较 长 的 编码 表示 ,通过 这 样 的 方式 同样 可 提高 编码 的 


7.2 JPEG 图 像 压缩 标准 


7.2.1 JPEG 压缩 基本 系统 编码 器 


JPEG 压缩 是 有 损 压 缩 , 它 利用 人 的 视觉 系统 的 特性 ,将 量化 和 无 损 压 缩编 码 结合 去 
除 视觉 的 元 余 信息 和 数据 本 身 的 元 余 信 息 。 基 于 基本 系统 的 JPEG 压缩 编码 器 框图 如 


Tor AT AR o 


ae -ka 的 


图 7-1 基于 基本 系统 的 JPEG 压缩 编码 船 框图 


(1) 图 像 预 处 理 , 将 RGB 图 像 转 为 YCrCb 颜色 空间 。 

(2) 图 像 的 像素 点 按照 8 类 8 块 进行 采样 ,并 把 采样 得 到 的 无 符号 数值 减 去 固定 的 偏 
移 变 成 有 符号 的 数值 。 

(3) 2D-DCT ,对 第 一 步 得 到 的 8X8 块 的 有 符号 数值 进行 2D-DCT( 二 维 离散 余弦 变 
th) ,得 到 相应 的 2D-DCT AR. 

(4) 量化 ,把 步骤 (2) 得 到 的 2D-DCT 系数 根据 JPEG 提供 的 量化 表 进 行 量化 ,得 到 
相应 的 量化 系数 。 

(5) Zig-zag 扫描 ,把 步骤 (3) 得 到 的 量化 系数 进行 Zig-zag 扫描 。 

(6) Wits. AR ZEN RAM AAI ARM CRAM. WAT AMT Ba 
预测 编码 ,而 对 交流 系数 进行 Huffman 编码 。 


7.2.2 图 像 空 间 转 换 


JPEG 采用 的 是 YCrCb 颜色 空间 ,而 BMP 采用 的 是 RGB 颜色 空间 ,要 想 对 BMP 图 
片 进行 压缩 ,首先 需要 进行 颜色 空间 的 转换 。YCrCb 颜色 空间 中 ,Y 代表 亮度 ,Cr、Cb 则 
代表 色 度 和 饱和 度 ( 也 有 人 将 Cb、Cr 两 者 统称 为 色 度 ) ,三 者 通常 以 Y、U、V 表示 , 即 用 UU 
代表 Cb ,用 V 代表 Cr. RGB 和 YCrCb 之 间 的 转换 关系 如 下 。 
k = 0, 299R 十 0.587G 十 0. 114B 


Cb =—0. 1687R 一 0. 3313G 十 0.5B +128 (7-1) 
Cr = 0.5R — 0.418G — 0. 0813B + 128 
一 般 来 说 ,C 值 ( 包 括 Cb、Cr) 应 该 是 一 个 有 符号 的 数字 ,但 这 里 通过 加 上 128, 使 其 
变 为 8 位 无 符号 整数 ,从 而 方便 数据 的 存储 和 计算 。 
R = Y +1. 402(Cr—128) 
G = Y—0. 34414(Cb—128) —0. 71414(Cr—128) (7-2) 
B = Y +1.772(Cb—128) 


7.2.3 采样 


研究 发 现 ,人 眼 对 亮度 变换 的 敏感 度 要 比 对 色彩 变换 的 敏感 度 高 很 多 。 因 此 ,可 以 认 
为 Y 分 量 要 比 Cb、Cr 分 量 重要 的 多 。JPEG 图 片 中 ,通常 采用 两 种 采样 方式 : YUV411 
和 YUV422, 它 们 代表 的 意义 是 Y.Cb、Cr 3 个 分 量 的 数据 取样 比例 一 般 是 4: 1 : 1 或 者 
4:2:2(4:13:1 的 含义 是 ; 在 2X2 的 单元 中 ,本 应 分 别 有 4 个 Y.4 个 U4 个 V 值 ,用 

86 


第 7 章 数字 图 像 水 印 技术 


12B 存储 。 经 过 4:1:1 和 采样 处 理 后 ,每 个 单元 中 的 值 分 别 有 4 个 Y. 1 个 U、l 个 V, 只 
6B 就 可 以 存储 了 ) 。 这 样 的 采样 方式 虽然 损失 了 一 定 的 精度 ,但 也 在 人 眼 不 太 察 觉 到 
的 范围 内 , 减 小 了 数据 的 存储 量 。 当 然 ,JPEG 格式 里 也 允许 将 每 个 点 的 ULV 值 都 记录 
下 来 。 

由 于 后 面 的 DCT 是 对 8X8 的 子 块 进行 处 理 , 因 此 ,在 进行 DCT 之 前 必须 把 源 图 像 
数据 进行 分 块 。 源 图 像 中 每 点 的 3 个 分 量 是 交替 出 现 的 ,首先 把 这 3 个 分 量 分 开 ,存放 到 
3 张 表 中 ,然后 由 左 及 右 、 由 上 到 下 依次 读 取 8X8 的 子 块 ,存放 在 长 度 为 64 的 表 中 , 即 可 
以 进行 DCT。 注 意 , 编 码 时 程序 从 源 数 据 中 读 取 一 个 8X8 的 数据 块 后 ,进行 DCT. tk. 
编码 ,然后 再 读 取 、 人 处 理 下 一 个 8X8 的 数据 块 。 

JPEG 编码 是 以 每 8X8 个 点 为 一 个 单位 进行 处 理 的 。 所 以 ,如 果 原 始 图 片 的 长 宽 不 
是 8 的 倍数 ,就 需要 先 补 成 8 的 倍数 ,使 其 可 以 一 块 块 的 处 理 。 将 原始 图 像 数据 分 为 8X 
8 的 数据 单元 矩阵 之 后 ,还 必须 将 每 个 数值 减 去 128 ,然后 一 一 代入 DCT 公式 , 即 可 达到 
DCT 的 目的 。 图 像 的 数据 值 必须 减 去 128 ,是 因为 DCT 公式 所 接受 的 数字 范围 是 一 128 一 
iz? 


7.24 DCT 


静止 图 像 压缩 标准 JPEG 就 是 基于 DCT 的 压缩 标准 。 离 散 余 蓄 变 换 在 图 像 处 理 中 
占有 非常 重要 的 位 置 ,尤其 是 在 图 像 的 变换 编码 中 有 非常 成 功 的 应 用 。 离 散 余 弦 变 换 本 
质 上 是 傅 里 时 变换 的 实数 部 分 ,但 是 和 傅 里 叶 变 换 相 比 , 它 具有 更 强 的 信息 集中 能 力 。 对 
于 大 多 数 自然 图 像 ,离散 余弦 变换 能 将 其 主要 信息 通过 少量 系数 表示 ,因而 具有 较 高 的 编 
码 效率 。 

一 维 N 点 离散 余弦 变换 (DCT) 的 定义 和 和 矩阵 表示 形式 如 式 (7-3) 所 示 。 


jj ,nt Dkr 
pe = H, | N ŽC) cos oN (7-3) 


yk) = Hz (n) 
式 (7-3) 中 ,7， p= os, N 一 1, 系 数 是 ;为 : H, =1/V/2, 24k Æ 0 时 ， sm 二 维 
N 点 DCT 的 定义 和 和 矩阵 表示 如 式 (7-4) 所 示 。 


,2 Oy (7+lD)or (2 十 1)ux 
Yu = NHuHy 2, 2, Xscos aN cS aN (7-4) 


JPEG 压缩 中 采用 的 2D-DCT 一 般 是 8 点 DCT, 得 到 的 2D-DCT 系数 是 一 个 8X8 的 
矩阵 ,和 矩阵 的 第 一 个 数据 称 为 DC 系数 ,剩余 63 个 数据 称 为 AC 系数 。 


7.2.5 量化 


经 过 DCT 之 后 ,一 个 8X8 的 像素 矩阵 便 转 换 成 8x8 的 频 域 矩阵 ,低频 分 量 分 布 在 
8X8 数据 的 左上 角 ,高 频 分 量 分 布 在 右 下 角 。 但 DCT 本 和 号 并 不 能 实现 码 率 压缩 ,64 个 
像素 值 仍 然 得 到 64 个 系数 ,而 且 还 增加 了 比特 数 。 量 化 是 对 经 过 DCT 得 到 的 64 个 
DCT 系数 按 比 例 缩 小 ,并 四 人 铭 五 人 取 其 整数 值 的 一 个 过 程 。 它 在 图 像 文 件 品 质 和 压缩 比 
例 之 间 做 一 个 平衡 ,在 保证 一 定 的 图 像 质 量 的 前 提 下 , 舍 掉 图 像 中 对 视觉 效果 影响 不 大 的 
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信息 。 
JPEG 标准 中 的 量化 过 程 是 对 64 个 频 域 系数 除 以 各 目的 量化 步 长 ,得 到 的 量化 结果 
四 舍 五 入 即 为 量化 系数 。 量 化 步 长 存放 于 量化 表 中 ,量化 表 是 一 个 8X8 的 矩阵 ,与 DCT 
系数 一 一 对 应 , 它 是 控制 JPEG 压缩 比 的 关键 因 系 。 

由 于 人 了 眼 视觉 系统 的 频率 啊 应 随 空间 频率 的 增加 而 下 降 , 即 人 眼 对 高 频 分 量 远 不 如 
对 低频 分 量 敏感 ,而 且 图 片 的 点 与 点 之 间 会 有 一 个 色彩 过 渡 的 过 程 , 低 频 分量 集 中 了 大 部 
分 图 像 信息 ,所 以 可 以 将 人 眼 视 觉 系统 不 太 敏感 的 高 频 分 量 舍弃 。 鉴 于 此 ,低频 分 量 的 量 
化 系数 对 应 的 量化 步 长 较 小 ,相应 的 失真 也 小 ,所 包含 的 信息 损失 较 少 ,高 频 分 量 的 量化 
系数 对 应 的 量化 步 长 较 大 ,信息 损失 较 大 ,但 是 视觉 效果 上 不 会 有 很 大 的 变化 。JPEG Æ 
缩 标准 中 给 出 了 推荐 量化 表 , 因 为 本 文 仅 对 灰 度 图 像 进行 压缩 ,所 以 只 使 用 到 亮度 量化 
表 , 表 7-1 即 JPEG 推荐 亮度 量化 表 , 表 7-2 即 JPEG 推荐 色 度 量化 表 。 

表 7-1 JPEG 推荐 亮度 量化 表 


这 两 张 表 依据 心理 视觉 靖 制 作 ,对 Sb 亮度 和 色 度 的 图 像 的 处 理 效 果 较 好 。 量 化 表 是 
控制 JPEG 压缩 比 的 关键 ,这 个 步骤 除 掉 了 一 些 高 频 量 ,损失 了 很 多 细节 信息 。 但 事实 
上 ,人 有 眼 对 高 频 信 号 的 敏感 度 远 没有 对 低频 信号 那么 敏感 。 所 以 ,处 理 后 的 视觉 损失 很 
小 。 从 上 面 的 量化 表 也 可 以 看 出 ,低频 部 分 采用 了 相对 较 短 的 量化 步 长 ,而 高 频 部 分 则 采 
用 了 相对 较 长 的 量化 步 长 ,这样 做 也 是 为 了 在 一 定 程度 上 得 到 相对 清晰 的 图 像 和 更 高 的 
压缩 率 。 另 一 个 重要 原因 是 ,所 有 图 片 的 点 与 点 之 间 会 有 一 个 色彩 过 湾 的 过 程 ,而 大 量 的 
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图 像 信息 都 包含 在 低频 率 空间 中 ,经 过 DCT 处 理 后 ,高 频率 部 分 将 出 现 大 量 连续 的 零 。 

7.2.6 Zig-zag 扫描 

经 过 量化 之 后 得 到 的 量化 系数 矩阵 , 非 零 系数 一 般 集中 在 矩阵 的 左上 方 , 右 下 方 的 高 
频 分 量 多 数 变 为 0。 由 于 在 FPGA 中 数据 存储 是 线性 存储 的 ,如 果 将 量化 系数 矩阵 按 行 
定 采用 Zigzag 顺序 存储 量化 系数 , 即 从 左上 角 开 始 ,以 “之 ”字形 方式 扫描 到 右 下 角 , 把 
二 维 矩 阵 转换 为 一 维 数据 序列 ,这 样 也 把 高 频 分 量 的 0 (GEE — E , WIE eB A Gia 
码 。Zig-zag 的 地 址 扫描 顺序 如 图 7-2 所 示 。 


aca 
ar [ada 


A 
四 
re 


7-2 Zig-zag 的 地 址 扫描 顺序 


7.2.7 ÄRA 


JPEG RE 25 E A) 8 t A IE E Huffman 编码 。Huffman 编码 的 理论 基础 是 变 
长 编码 ,利用 不 同 符 号 的 概率 分 布 进 行 不 同 长 度 的 编码 ,从 而 实现 数据 压缩 的 目的 。 对 于 
由 量化 硕 输 出 的 量化 系数 ,JPEG 采用 定 长 和 变 长 结合 的 编码 方法 ,具体 如 下 所 示 。 

(1) 直流 (DC) 系 数 。 

由 于 图 像 中 相 邻 的 两 个 图 像 块 的 DC A BG EIR ER. AL JPEG 对 量化 后 的 直流 
系数 采用 无 失真 DPCM (Difference Pulse Code ModulaTIon) 44 45 , EU Xt 4 ny 8 <8 RAE 
流 系数 FF;(0,0) 和 己 编 码 的 前 一 个 8X8 块 的 直流 系数 下;-1(0,0) 的 差 值 进行 编码 。 假 设 
某 一 个 8X8 图 像 块 的 DC 系数 值 为 15, 而 上 一 个 8X8 图 像 块 的 DC 系数 为 12, 则 两 者 之 
间 的 差 值 为 3。 

按照 得 到 的 差 值 的 取 值 范围 ,JPEG 把 差 值 进行 分 类 。 编 码 时 ,将 DC 系数 的 差 值 表 
示 为 “(符号 1 ,符号 2) 的 形式 ,其 中 符号 1 是 用 目 然 二 进 制 码 表示 DC 差 值 所 需要 的 最 少 
位 数 ,可 通过 查 表 得 到 。 符 号 2 为 实际 的 差 值 。 对 于 符号 1, 采 用 Huffman 编码 。 由 于 党 
度 和 色 度 分 量 的 DC 差 值 统计 特性 差别 较 大 ,所 以 JPEG 分 别 给 出 了 推荐 使 用 的 Huff- 
man REBRA Huffman 色 度 码 表 。 对 符号 2, 来 用 自然 二 进 制 码 表示 , 即 用 差 值 的 反 
码 表 示 。 正 数 的 反 人 码 是 它 本 号 ,负数 的 反 人 码 用 正 数 的 反 人 码 表 示 。 例 如 , 差 值 为 12, 用 
“1100” 表 示 。 
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(2) AC 系数 的 行程 长 度 编码 (RLC) 。 

经 过 Zig-zag 扫描 之 后 ,交流 系数 会 出 现 连 续 的 等 ,所 以 JPEG 对 零 交 流 系数 进行 游 
程 长 度 编 码 ,即将 所 有 的 交流 系数 用 00…OA 的 形式 表示 。 其 中 ,A 代表 非 零 值 , 若 干 连 
续 个 0 和 一 个 非 零 值 A 组 成 一 个 编 公 的 基本 单位 。 因 此 ,采用 行程 编 公 (Run Length 
Coding,RLC) 更 进一步 降低 了 数据 的 传输 量 。 

JPEG 将 交流 系数 中 的 非 零 系数 同样 进行 分 类 , 即 用 目 然 二 进 制 码 表 示 非 零 值 所 需 
的 最 小 位 数 。 于 是 ,可 以 把 一 个 基本 编码 单位 表示 为 (符号 1, 符 号 2) 的 形式 。 其 中 ,符号 
2 表示 的 是 非 零 的 AC 系数 的 幅 值 ;符号 1 为 (游程 /类 别 ), 即 游程 和 类 别 的 组 合 , “游程 ” 
表示 每 个 8X8 RAY AC 系数 中 连 0 的 长 度 ,“ 类 别 ” 表 示 对 非 零 系数 进行 自然 二 进 制 编码 
需要 的 最 少 位 数 , 即 对 符号 2 编码 的 位 数 。 

与 DC 系数 的 编码 类 似 ,对 符号 1 采用 Huffman 编码 进行 编码 ,JPEG 同样 给 出 了 
AC 系数 亮度 Huffman 码 表 和 AC 系数 色 度 Huffman 码 表 : 对 符号 2, 也 采用 自然 二 进 
til Fat. JPEG 有 两 种 特殊 情况 : O44 0 的 个 数 超过 或 者 等 于 16 时 ,符号 1 用 ZRL 
(F/0) 表 示 ,同时 对 连 0 个 数 重新 计数 ;外 每 个 8X8 块 结束 时 ,用 EOB(0/0) 表 示 , 即 块 结 
束 标志 o 

例如 , 现 有 一 个 字符 串 , 如 下 所 示 : 

经 过 RLC 之 后 ,将 呈现 出 以 下 形式 : 

(0:57); C0-45); (4523)5 (ls—30)s C0;— 8); C21); (050) 

注意 ,如 果 AC 系数 之 间 连 续 0 的 个 数 超过 16 , 则 用 一 个 扩展 字 节 (15 ,0) 表 示 16 个 
连续 0。 

(3) AC 系数 的 中 间 格 式 。 

根据 前 面 提 到 的 VLI 表 格 , 对 于 前 面 的 字符 串 

(0,57); (0,45);(4,23); (1,—30); (0O,—8); (2,1); (0,0) 
只 处 理 每 对 数 右 边 的 那个 数据 ,对 其 进行 VLI 编码 : 查找 上 面 的 VLI 编码 表格 可 以 发 
现 ,57 在 第 6 组 中 ,因此 可 以 将 其 写成 (0,6,57) 的 形式 ,该 形式 称 为 AC 系数 的 中 间 
格式 。 

同样 ,(0,45) 的 中 间 格 式 为 (0,6),45;(1, 一 30) 的 中 间 格 式 为 (1,5), 一 30。 

得 到 DC 系数 的 中 间 格 式 和 AC 系数 的 中 间 格 式 之 后 ,为 进一步 压缩 图 像 数 据 , 有 必 
要 对 两 者 进行 炉 编 码 。JPEG 标准 具体 规定 了 两 种 炉 编 码 方式 : Huffman 编码 和 算术 编 
码 。JPEG 基本 系统 规定 采用 Huffman 编码 (因为 不 存在 专利 问题 ) ,但 JPEG 标准 并 没 
有 限制 JPEG 算法 必须 用 Huffman 编码 方式 或 者 算术 编码 方式 。 

Huffman 编码 : 对 出 现 概率 大 的 字符 分 配 字 符 长 度 较 短 的 二 进 制 编码 ,对 出 现 概率 
小 的 字符 分 配 字符 长 度 较 长 的 二 进 制 编码 ,从 而 使 得 字符 的 平均 编码 长 度 最 短 。Huff- 
man 编码 的 原理 请 参考 数据 结构 中 的 Huffman 树 或 者 最 优 二 又 树 。 

Huffman 编码 时 ,DC 系数 与 AC 系数 分 别 采 用 不 同 的 Huffman 编码 表 , 对 于 亮度 和 
色 度 ,也 采用 不 同 的 Huffman 编码 表 。 因 此 ,需要 4 张 Huffman 4g 05 22. A RE SE Be A Sn 
码 的 工作 。 有 具体 的 Huffman 编码 采用 查 表 的 方式 高 效 地 完成 。 然 而 ,在 JPEG 标准 中 没 
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有 定义 默认 的 Huffman 表 , 用 户 可 以 根据 实际 应 用 自由 选择 ,也 可 以 使 用 JPEG 标准 推 
42H) Huffman 表 。 或 者 预先 定义 一 个 通用 的 Huffman 表 , 也 可 以 针对 一 副 特 定 的 图 像 ， 
在 压缩 编码 前 通过 搜集 其 统计 特征 计算 Huffman KHE. 


加 | O 图 像 水 印 


许多 早期 的 工作 , 主要 将 通信 和 领域 的 扩 频 原理 应 用 于 水 印 技术 中 5 。Cox 等 人 
提出 了 类 似 于 扩 频 通信 的 方法 529 ,他 们 用 随机 产生 的 白 高 斯 噪声 代替 水 印信 号 而 艇 人 
在 宿主 图 像 的 DCT 块 的 最 大 非 直流 系数 中 。Hsu 和 Wu 对 文献 [127] 中 的 方案 加 以 修 
改 , 他 们 将 水 印 租 入 在 宿主 图 像 的 DCT 的 中 频 系 数 中 一” ,而 且 还 将 这 一 方案 推广 到 基 
F MPEG 的 视频 水 印 中 一"” 。 和 其 他 方法 不 同 ,Tao 和 Dickinson 使 用 人 类 视觉 的 各 种 隐 
蔽 效果 进行 水 印 的 敌人 一 ” 。 其 他 的 在 DCT 域 中 的 舱 入 方案 有 文献 L130-134j 中 介绍 的 
方案 。Xia 等 人 提出 了 使 用 离散 小 波 变 换 的 分 级 的 扩 频 水 印 方法 ”9 ,类 似 的 一 些 还 有 
文献 [L137 ,138j 等 介绍 的 方法 。S. Pereira 等 人 提出 了 基于 FFT( 快 速 离散 傅 里 叶 变 换 ) 域 
的 对 于 旋转 等 几何 攻击 鲁 棒 的 水 印 方案 ?2 。Podilchuk 和 Zeng 提出 了 对 文献 [126] 
介绍 的 方法 扩展 的 水 印 方法 5 ,他们 结合 了 人 类 视觉 系统 (HVS) 提 高 水 印 的 不 可 视 
PERI BPE. Tirkel 等 人 提出 了 灰 度 图 像 的 水 印 算法 汪 ,但 这 种 水 印 算 法 不 适合 于 
对 和 鲁 棒 性 要 求 高 的 应 用 场合 。Hnus 将 二 进 制 的 版 权 图 案 , 而 不 是 随机 的 伪 随 机 信号 散人 入 
FE UR PE ,该 方案 的 缺点 是 在 水 印 检测 时 需要 原始 图 像 。J. R. Smith 等 人 利用 信 
息 论 的 方法 分 析 和 评估 隐藏 信道 性 能 ,运用 信息 理论 的 基本 原理 估计 图 像 中 可 以 
改变 的 信息 量 , 也 就 是 水 印信 道 的 理论 容量 ,建立 了 水 印信 道 的 模型 ,分析 了 加 性 噪声 下 
水 印 的 容量 ,但 这 样 获得 的 水 印 容量 只 能 是 一 种 理论 参考 。Teddy 提出 了 在 不 使 用 原始 
数据 的 情况 下 水 印 的 相关 检测 算法 号 。Juan R. 等 人 提出 了 水 印 的 统计 分 析 模 型 , 利 
用 假设 检验 的 方法 对 水 印 进行 检测 5]。 

总 结 以 上 提 及 的 图 像 水 印 方案 ,在 构造 基于 自 适 应 于 图 像 内 容 的 鲁 棒 水 印 方面 ,众多 
算法 采取 直接 提取 图 像 的 特征 系数 加 入 水 印 , 而 在 对 特征 系数 的 改变 上 则 使 用 VS 或 
者 按照 子 信 道 最 大 容量 等 的 算法 确定 水 印 的 权 值 ,这 样 ,避免 在 图 像 的 平坦 区 域 由 于 加 入 
水 印 而 出 现 失 真 。 也 有 一 些 学 者 提出 了 水 印 应 该 府 人 在 那些 具有 显著 特征 的 图 像 像 素 
上 ,但 很 少 有 人 明确 提出 如 何 针 对 不 同 的 图 像 检 测 出 这 些 显著 的 特征 点 。 针 对 以 上 存在 
的 问题 ,我 们 在 设计 的 水 印 方案 中 提出 了 新 的 设计 思路 和 有 效 的 算法 。 


OTa 图 像 水 印 设计 方案 


7.4.1 图 像 水 印 化 模型 


选择 在 图 像 的 DCT RAKE ,主要 是 因为 DCT 域 提供 了 一 个 不 同 频率 和 图 像 能 
量 之 间 的 分 布 情况 ,而 水 印 可 选择 适当 的 DCT MP HMR RA. HAA ZK RRA ER AI 
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c= {c,} 
FHER 统计 模型 logo 
k, 
~ w= fw} 
中 | 混沌 映射 


模糊 商 测 度 
I 


ARI 图 像 重建 ” el kag 


图 7-3 详细 的 水 印 散 入 模型 


如 图 7-3 所 示 。 


了 代表 原始 图 像 。 

工 代表 水 印 化 的 图 像 。 

c 一 (co) 为 数字 图 像 DCT 的 变换 系数 。 

logo 为 商标 或 者 有 意义 的 明文 或 者 用 户 的 ID 号 。 

= {a,} 为 水 印 的 租 人 系数 ,调节 水 印 般 人 的 强度 。 

e = {e, } 为 调制 后 的 水 印 序列 。 

k, 为 用 户 的 私 钥 ,这 种 私 钥 在 水 印 方案 中 可 能 指 秘密 的 参数 的 集合 。 

|= {cr AIKEN {EY DCT 系数 。 

X 二 (xa) 为 最 终 形成 的 水 印 化 的 数据 。 

工 代 表 水 印 化 的 图 像 。 

在 图 像 水 印 的 能 人 模型 中 ,原始 的 版 权 信 息 , 如 用 户 的 商标 或 者 注册 的 ID 序列 通过 
私 钥 (加 密 ) 混 沌 映射 ,得 到 二 进 制 随机 置 乱 的 水 印 w= iw, ) 序列 ,然后 被 租 人 到 从 原始 
数字 图 像 工 中 采样 出 的 特征 集合 c 王 {tc}/ 中 。 这 里 ,特征 集合 的 元 素 是 数字 图 像 的 相关 的 
DCT 变化 系数 。 水 印 化 系数 在 图 像 中 的 空间 分 布 由 模糊 炉 确 定 , 也 就 是 在 藤 入 商标 前 ， 
首先 使 用 模糊 信 测 度 算法 检测 图 像 中 适合 信息 隐藏 的 那些 显著 的 特征 区 域 ,然后 将 水 印 
i A FE XE KEY) DCT 块 的 系数 中 ,以 获得 更 高 的 鲁 棱 性 。 


7.4.2 基于 FEMA 算 法 的 图 像 特征 的 提取 


构造 鲁 棒 性 的 水 印 能 够 有 效 抵 抗 如 压缩 .剪裁 .噪声 污 染 等 其 他 类 型 的 攻击 。 结 合 图 
像 压缩 编码 的 特点 ,将 需要 租 人 的 信息 分 布 在 图 像 中 具有 显著 特征 的 边缘 周围 以 及 纹理 
化 的 区 域 , 其 原因 在 于 这 些 部 分 的 频率 成 份 丰富 ,数值 变化 明显 ,相对 于 平滑 区 域 ,HVS 
对 于 发 生 在 这 些 高 亮度 区 域 中 的 失真 不 十 分 敏感 *”， ,因而 数据 可 改变 的 容量 相对 要 大 。 
所 以 ,在 水 印 舱 入 前 ,需要 对 原始 图 像 在 空间 域 中 的 特征 分 布 进行 检测 。 本 书 提出 了 基于 
RRR "的 边缘 检测 算法 ,其 定义 如 下 。 

iI = {zx(i, j),0<i<M,0<j<N, xli, j) E10,1,…,G 一 1}) 表示 大 小 为 MXN 
MF AR, cG, 站 是 坐标 (i, 7) 人 处 像素 的 灰 度 值 ,G = 256。 将 图 像 中 像素 的 灰 度 归 一 
化 到 [0,1j] 区 间 , 仍 记 作 eG, 7 站 为 以 图 像 的 灰 度 级 为 讨论 域 ,定义 一 个 具有 某 种 特征 的 模 
WEG ,其 隶属 度 如 下 。 
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Um (xis j)) Fes) tae ee (7-5) 


式 (7-5) 表 示 了 图 像 中 像素 与 其 所 属 区 域 的 隶属 程度 ,一 个 像素 与 其 所 属 区 域 特征 值 
的 差异 越 小 ,该 像素 的 隶属 度 越 大 ;反之 , 则 该 像素 的 隶属 度 越 小 。 式 中 ,C 为 常数 ,以 保 
证 0.5 志 w(x(i,7)) 三 1, 也 就 是 期 望 图 像 中 任 一 像素 的 隶属 度 不 小 于 0.5。 在 上 述 模糊 
集合 上 定义 一 个 模糊 炉 -”…- 如 下 。 


HLun (xisj)) | =— un (xGsj)) log: Lun (xG.j))] 
— [1 — wu, (x@,j)) Jlogzs [1 —un(xGi,j)) ] (7-6) 
PRE RA x (i,j) 的 大 小 而 变化 的 曲线 如 图 7-4 所 示 。 可 以 看 出 , 当 灰 度 值 
xi.j)=m,(m€L0,1]) BOR D BE rG, j) =m 附近 具有 对 称 性 。 


] 
E 
3 0.5 
=, 
0 
0 m 0.5 


Xx 


图 7-4 OMA MGB x 的 变化 曲线 


一 般 地 ,图像 中 具有 显著 特征 点 的 邻 域内 的 灰 度 分 布 和 其 他 点 邻 域 内 的 灰 度 分 布 不 
同 , 平 坦 点 的 邻 域内 通常 只 有 一 种 灰 度 分 布 ,具有 显著 特征 点 的 邻 域内 灰 度 分 布 的 差异 较 
大 。 本 文 定义 一 种 模糊 精 测 度 表 征 这 种 灰 度 分 布 的 有 序 性 。 

在 图 像 的 灰 度 值 矩 阵 中 取 一 个 大 小 为 2Xm PUD FE GA BA W, (i,]) 


时 1) 
全 (zy7) = apa tuS l, j) Pate j) ali Lly j) a (7-7) 


MERAH W, G.E., EL PSE TO I SB a BE a WWE RG. DA 
l (n—1)/2 (n—1)/2 7 | 
7 2 _ Hua Lun(xGitk.jt+l))] (7-8) 
ER (7-8) HH mx Cin j) « HUY A E HP AY HEA De RE AE A A O Pob G, j) Ab DE fi 
LCi. j) AAS BK BE DAY , Ze AA TK ARR Ab FA RAE eK a BI RG ARB. KK 
之 , 当 该 像素 处 于 图 像 的 特征 显著 ,或 者 能 量变 化 较 大 的 区 域 ( 边 缘 、 纹 理 ) 时 , 则 尺 Cz,7) 
较 大 。 本 质 上 ,RGz,7) 反 映 了 图 像 变化 的 不 定性 ,这 种 性 质 为 在 图 像 中 寻找 适合 隐藏 水 印 
信息 的 区 域 提供 了 理论 上 的 一 种 依据 。 为 了 和 基于 图 像 8X8 分 块 处 理 的 水 印 算 法 一 致 ， 

可 是 义 第 & 个 图 像 块 的 信息 测度 为 

R = i DRC) uyv = 1,258 (7-9) 
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7.4.3 商标 置 乱 及 水 印 产 生 


我 们 使 用 混沌 映射 的 方法 ,将 商标 进行 随机 置 乱 。 置 乱 的 目的 有 两 个 : 一 是 排列 有 
序 的 商标 经 过 置 乱 后 ,服从 伪 随 机 序列 的 概率 分 布 的 特点 ;为 一 个 原因 是 ,从 水 印 系 统 的 
安全 考虑 ,因为 注册 的 商标 本 号 是 可 识别 或 者 说 是 可 读 的 ,直接 将 注册 商标 加 入 图 像 中 ， 
一 且 有 关 商 标 信 息 被 泄露 ,那么 ,对 于 攻击 者 ,同样 可 使 用 相同 的 商标 采用 不 同 的 手法 进 
行 版 权 的 伪造 。 因 此 ,商标 的 置 乱 无 论 对 水 印 的 租 入 ,还 是 检测 ,以 及 整个 系统 的 安全 ,部 
是 很 重要 的 一 个 环节 。 从 技术 上 讲 , 置 乱 可 以 理解 为 一 种 信号 的 映射 , 置 乱 使 用 的 参数 被 
认为 是 版 权 者 的 密 铀 ,只 有 版 权 者 唯一 和 擎 握 密 钥 ,才能 对 商标 进行 秘密 的 隐藏 和 正确 的 检 
测 。 本 方案 采用 G. Voyatzis 等 人 在 文献 L151,161j] 中 使 用 的 混沌 映射 的 算法 实现 对 商标 
的 置 乱 。 该 映射 算法 可 氢 述 如 下 。 

考虑 一 二 维 回 量 在 空间 域 的 ”和 目 同 构 "变换 ,可 以 用 数学 上 的 一 映射 表示 : 


而 且 可 由 下 面 的 公式 定义 
r = Ar(mod 1), (>) f Hi (7 ) (mod 1) (7-11) 
Y y+ Qe, Q22) \Yn’ 


这 里 ,a;,; EZ, det A=1, MHA WIE A €{—1,0,1}. Æ—M ro EU 上 对 A 的 
迭代 将 形成 一 动态 的 系统 A” UU, RAUF. 
Tea = A'r, (mod 1), 或 者 ras = Ar, (mod 1) (7-12) 
HE, n= 001, 25°, 
对 该 映射 的 几 个 特性 总 结 如 下 。 
(1) 因为 a;,; EZ,det A 二 1, 所 以 这 种 “ 同 构 ”迭代 的 逆 存 在 , 即 存 在 矩阵 4 a 
A ,使 
r= A'r (mod 1) (7-13) 
同样 ,mm 一 (4 ) 4, Gmod 1) 或 者 rr =Ar, (mod 1), 
(2) Arie E 《一 1,0,1} 保 证 映射 的 混沌 性 。 
(3) 对 式 (7-8) 进 行 迭代 ,所 有 点 oro) = (mmyr，……)} 构 成 的 集合 是 系统 的 一 个 采 
样 轨 道 COrbit) ,在 一 特殊 的 (Anosov Differomophisms) 类 中 构成 目 同 构 , 这 种 同 构 在 混 
沌 系统 中 符合 局 部 不 稳定 .各 态 历 经 并 且 弱 相关 。 粗 略 地 讲 , 如 末 Yo 是 U 上 的 一 个 密集 ， 
那么 在 映射 A 下 的 和 WV 的 像 V, 随 机 地 扩展 到 整个 U 的 空间 上 。 
(4) 在 有 限 空间 上 ,初始 位 置 m 具 有 有 理 数 坐标 (充分 必要 和 条件) 条件 下 , 则 轨迹 
olro) = {Fo oi ,Tz，,…) 是 周期 的 , 即 存 在 一 迭代 次 数 工 能 够 使 ro 二 rz。 
CS) 轨道 的 演变 唯一 地 依赖 于 矩阵 的 特征 值 A1( 或 者 $4;:)”"” - 。 因 此 , 自 同 构 是 一 个 单 


trace A = ay Faz = fA) 
在 版 权 保 护 中 ,用 户 的 商标 (二进制 图 像 ) 需 要 预先 进行 随机 的 置 乱 ,成 为 像 噪声 一 样 
的 随机 信号 ,这 种 随机 信号 将 被 当 作 水 印 舱 入 到 多 媒体 数据 中 。 基 于 对 以 上 “ 自 同 构 ” 映 
射 及 其 性 质 的 研究 ,可 据 此 建立 图 像 水 印 的 置 乱 映射 : 
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PERR Lai l 1 | b , 
AnC \= | )( ) mod N) (7-14) 


H , Can s Yn) r Erra Int IAA AR PSE BIRR A A A A i SAR. N,kE 
[1,N)CZ 。 这 里 ,和 矩阵 的 最 大 特征 值 可 通过 计算 确定 为 A 510. 5H C +4k)"”), 
而 且 对 于 任何 & > 0, 都 是 正 的 实数 。 
映射 式 (7-10) 可 直接 用 于 正方 形 ( 还 可 以 推广 到 非 正方 形 的 情况 ) 的 图 像 工 或 者 图 像 
中 的 一 个 N XN 大 小 的 正方 形 子 块 UDCT。 通 过 迭代 过 程 可 产生 一 系列 混合 的 块 
UF = AU. 三 2 了 一 1] (7-15) 
这 里 ,T 是 重 现 的 次 数 ( 周 期 )。 从 UU” 对 UU 的 重建 可 通过 应 用 一 个 道 的 自 同 构 的 过 
程 完 成 ,通常 情况 下 存在 
U = ARF (WUP = AR” (kU® (7-16) 
实际 应 用 中 ,假设 原始 的 版 权 商 标 是 一 二 进 制 的 大 小 为 S; X S, 的 BMP 图 像 , 表 
不 为 


LOGO = {Li | 0 bs E {0,1}} (7-17) 
原始 图 像 或 者 图 像 的 子 块 的 大 小 为 NXN, 可 表示 为 
I = {Li | 0 = k,l < N, Lazi e {O,1,°°.G }} (7=18) 


G 为 图 像 的 最 大 灰 度 值 。 假 设 条 件 S1 XS.<<NXN 成 立 。 
式 (7-17) 可 获得 置 乱 的 商标 图 像 


将 式 (7-16) 直 接应 用 于 


LOGO’ < Ai(k) LOGO, i 一 1,2,…,T 一 1 (7-19) 
其 中 ,LOGO' =(Ly.7|0<k’ LN, Ler E {0,—1,1}}. 令 
ls d62—41 
Ler = ml; Lyd (7-20) 
0， 其 他 


事实 上 ,LOGO 中 只 有 原始 商标 映射 来 的 位 置 上 的 像素 是 真正 的 置 乱 信息 ,而 其 他 
的 位 置 的 像素 置 零 。 将 LOGO 中 有 用 的 信息 按照 行列 先后 位 置 重新 排列 ,得 到 置 乱 的 二 
维 水 印信 号 W,W 中 的 信息 将 被 舱 入 到 从 图 像 有 来 样 得 到 的 显著 特征 中 。 


7.4.4 水 印 的 散 入 算法 


(1) 将 亮度 图 像 1 分 解 成 互 不 重 半 的 8X8 KRH, I= U B, Cu, v) , (u,v) EIRP 


的 坐标 u,v 二 1,2,…,8,N 是 能 分 成 块 的 个 数 ,用 FEMA 的 算法 对 整个 图 像 上 分 块 的 模 
糊 科 测度 进行 统计 检测 ,设置 门限 r 及 水 印 标志 位 如,& 一 1,2,…，N, 检 测 尺 ,如 果 民 全 
r, 则 置 b =1, A b =0. r 的 值 可 根据 艇 人 水 印 需要 块 的 最 大 数量 而 自 适 应 地 调节 。 

(2) 选择 BMP 图 像 作 为 用 户 的 商标 ,在 商标 舱 入 前 进行 空间 域 的 混沌 映射 。 映 射 算 
法 本 身 可 被 认为 是 公开 的 ,而 对 于 具体 的 应 用 ,由 于 选择 不 同 参 数 可 获得 不 同 的 映射 空间 
和 置 乱 效 果 , 因 此 参数 kd、p、S 可 被 认为 是 用 户 的 密 钥 。 同 样 ,将 置 乱 后 的 ww 分 成 互 不 
men N 个 4X4 的 分 块 而 能 人 到 相应 的 DCT Hep., 

(3) 水 印 的 般 入 基于 图 像 的 分 块 , 选 择 模糊 灿 测 度 大 于 门限 的 Ni 个 图 像 块 说 入 水 
印 , 即 若 包 一 0, 则 保持 原始 的 图 像 块 不 变 ; 若 广 王 1, 对 相应 的 图 像 块 进行 DCT, 
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隐 密 的 原理 及 应 用 


Cw sv )=DCT(B, (uso } u sv 一 1, 2 8。 
(4) 计算 相应 的 水 印 权 值 (xuo)。ws (u,v) 随 着 块 的 特征 系数 而 变化 ,在 具体 水 印 
藤 信 块 中 ,首先 对 局 部 的 变化 方差 m (u,v) 进 行 估 计 : 


| LV K, . oe 
2W +1 24 2, h lutiso tj) — peasy 


Op Cu sU) — 


re? 1 | g 
plu,v) = OW FD, OP Cut t;su+7) 
az. lusu) = AR:0 (u,v) (7-21) 
(5) 使 用 ax Cu, v) DNA A VE AY 7K EN w Cus v) , 块 中 水 印 化 的 系数 Cr Cuo) BIT Ra F 
CrO3t23¢0) 二 GGGH: 3 +o Fal +253 +H uv)w Ct, l) (7-22) 
这 里 ,i,7 二 1,2,…,4, 代 表 水 印 图 像 的 第 有 个 4X4 分 块 中 的 坐标 。 
(6) 在 选择 的 块 中 能 人 水 印 的 信息 后 ,用 Cz(x,o) 人 代替 Ci (w ,v) ,然后 进行 道 DCT, 
B} Cu v ) =IDCT( C} Cu.v)} ,各 个 水 印 化 的 分 块 重新 排列 ,最终 形成 水 印 化 的 亮度 图 像 。 
7.4.5 水 印 的 检测 及 商标 的 重 构 
1. 一 般 的 相关 检测 原理 
前 面 对 水 印 的 检测 已 提出 很 多 种 方法 ,在 这 些 方法 中 ,有 需要 原始 图 像 数 据 的 方法 ， 
也 有 不 需要 原始 图 像 数 据 的 方法 ,为 此 ,也 将 水 印 的 检测 区 分 为 “ 公 钥 水 印 ” 和 ”“ 私 钥 水 
印 ”。 在 检测 中 不 需要 原始 的 产品 数据 应 该 说 更 符合 水 印 的 实际 应 用 需求 。 这 里 简要 介 
绍 水 印 的 相关 检测 ,图 7-5 为 相关 检测 模型 。 


ry) aE (AST | | Z 1/0 
特征 提取 一 =| 相关 检测 门限 比较 


W, 
ELML HY! DF 好 || LS } 
同步 序列 统计 模型 SÀ 个 { 
Kp 


图 7-5 水 印 的 相关 检测 模型 


在 水 印 化 的 图 像 未 经 任何 失真 的 情况 下 ,由 图 7-3 可 得 
x = c, Fe, = c, Farw, (7-23) 
假如 水 印 化 的 图 像 没 有 受到 任何 失真 , 设 参考 的 水 印 序列 为 zw, 利用 相关 峰值 检测 
时 ,相关 函数 
$ra (D= EL Cen Farw) Wri] = EL Cen, Farw) wi 
= $a (D + anbuw’ CD) (7-24) 
在 文献 L162,163j 中 ,假设 w= (w, } A BEL AP, FLA} BFE (0.07). Caran Aw, 分 
别 为 平稳 的 且 相 互 之 间 独 立 的 统计 序列 ,因此 式 (7-24) 可 简化 为 
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$a w (L) = anP uw’ CL) (7-25) 

当 w, 衬 w 时 ,出 现 相 关 峰 值 ; 如 果 天 ,或 者 很 大 程度 上 不 相关 , 则 相关 函数 为 

零 或 者 很 小 。 实 际 中 常常 将 相关 器 输出 ( 设 为 Z) 和 一 设 定 的 门限 w 相 比较 ,如 果 Z>, 
则 数字 媒体 中 能 人 的 水 印 和 声明 的 水 印 相符 合 ,否则 不 符合 。 


2. Kalman 滤波 的 检测 原理 
Kalman 滤波 是 Wiener JEK A E EUA ,常用 于 随机 过 程 的 状态 参数 估计 , 它 的 特 
RBA: 中 其 数学 公式 可 用 状态 空间 的 概念 描述 ;外 它 的 解 是 递 推 计算 的 。 考 虑 一 动态 系 
统 , 它 可 由 描述 状态 回 量 的 过 程 方程 和 描述 观测 向 量 的 观测 方程 共同 表示 ,分 别 如 
式 (7-26) 和 式 (7-27) 所 示 。 
a(n) = F(n,n— l)xr(n— 1) +v, Cn— 1) (7-26) 
y(n) = CO x(n) + v2 (nr) (7-27) 


其 中 ， 

ZX(n) 表 示 系 统 在 时 刻 n 时 的 M X1 状态 向 量 。 

F(n,n 一 1) 表 示 N XM 状态 转移 矩阵 向 量 。 

vı (n—1)M X1 的 过 程 噪声 向 量 。 

y(n) 表 示 系 统 在 时 刻 n 的 NX1 观测 向 量 。 

Cin) RAR— EAA N XM 观测 矩阵 。 

v2(n) N X1 的 观测 噪声 向 量 。 

假设 : 

(1) vi 《nn) 和 v (2) 均 为 零 均 值 的 白 噪 声 过 程 , 即 

Elvu(m)] = 0; coviv(n),v (2) | 一 下 (CCR) | = Q (n)ln— k) (7-28) 
EL v(m) ] = 0; cov. vw (n), v: (k)] = Elv: (n) v2 (k)] = Q.(d(n—k) (7-29) 
以 上 两 式 中 ， 
Qı (n) = var(vi (n)) = ELv (n)vi (n) | 
Q: (n) = var(v,(n)) = E| v: (n)v: (n) ] 
分 别 为 v DA v2 Cn) AY BAP SE 
(2) vi(n) 和 vs(n) 相 互 独立 , 即 
cov| vi (2) v: (R) | = El vu, (muf (Rh) |] = 0, Vn,k 

(3) 初始 状态 2x10) 与 u (0) vv. (mn) an 0 均 不 相关 。 

如 果 没 有 两 个 噪声 ,由 式 (7-26) 和 式 (7-27) 立 即 可 求 得 x(n) ,当然 就 不 存在 估计 的 
问题 。 估 计 问 题 的 存在 正 是 因为 信号 与 噪声 三 加 在 一 起 , 而 要 估计 其 中 的 信号 的 真 值 。 
若 暂 时 不 考虑 vi(n) 和 v an) ,按照 式 (7-26) 和 式 (7-27) 得 到 的 eC) A y(n) AP HIF 2 (n) 
Aly (n) 表示 。 

2 (n) = F(nyn— 1) è? (n—1) (7-30) 
y(n) = Cn) #’(n) = CC) Fn n— 1) 2 (n— 1) (7-31) 
将 y Cr) 与 实际 观测 信号 的 误差 定 义 为 
Fn) = y(n) — $ (n) (7-32) 
显然 ,造成 式 (7-32) 的 误差 是 由 于 忽略 了 两 个 噪声 。 由 此 可 见 ,在 7(z) PRAT 
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vi(n) 和 vs(n) 的 信息 , 称 其 为 系统 的 “新 上 息 ” 过 程 。 奋 通过 一 日 (n) 加 权 7(z) 修正 式 
(7-30) 的 状态 估计 , 则 得 到 
去 (n) =F(n,n— 1) (nm 1) 
+ H(n)Ly(n) — Cn) F(a n— 1) # (n—1)] (7-33) 
将 式 (7-33) 中 参考 了 系统 “新 息 ” 得 到 的 估计 值 区 (n) 和 实际 信号 x(n) 之 间 的 差 值 
表示 为 x(n), W 
#(n)= x(n) — ln) = Flnsn Om— l)rlan— 1) +m (nn) — Cn) 
= [I— HMCM) ]LFCn,n— 1) (a(n— 1) — # (n— 1))+v(n)) 
— H (n)v: (n) (7-34) 
如 果 能 够 求 得 Tn) 均 方 误差 最 小 条 件 下 的 HC) ,根据 式 (7-33) 就 可 以 得 到 x(n) 
的 线性 最 优 估计 (nn) ,为 此 ,定义 均 方 误差 矩阵 
Pin) = E{[x(n) — Cn) JL 2G) — lm] } = EL? (Cn)F (n))| (7-35) 


P’(n) = E{LaQ@) — # (m [xn) — è (m JE} (7-36) 
悔 式 (7-33) 和 式 (7-34) 分 别 代 入 式 (7-35) 和 式 (7-36) 且 基于 前 面 3 条 假设 可 得 到 
Pian) =[I— H@)C@ | EC 一 1)PC2 一 1)FIC272 m1) + Qn)) 
e LI— H(n)C(n) J" + HMQ: mH Cn) (7-37) 
P’(n) =F(n,n—1)P(n—1)F!"(n,n— 1) +Q, (n) (7-38) 
经 过 系列 推导 (详细 推导 可 参考 文献 [L159]) 可 得 到 一 组 Kalman 一 步 递 推 公 式 : 
© (n) = F(n,n— 1) # (n—-1) +H@)[y@) —Cm)F(n,n— 1) # m— 1) 1 
P’(n) = F(n,n— 1)P(n— 1) F' n,n om 1) +Q,() 
P(n) = [I— H@)C() JP’ (n) 
Hn) = P’(n)C*(n)/[C(@) PnC Cn) + Q (nd J 
Kalman 估计 (nm) 的 一 步 递 推 法 如 图 7-6 所 示 。 


(7-39) 


图 7-6 Kalman 估计 z(n) 的 一 步 递 推 法 


这 种 递 推 计算 方法 用 计算 机 计算 十 分 方便 ,实际 中 可 以 根据 已 知 的 矩阵 FF(n,n 一 1)， 
Cn) 9 Qı Cn) „Q; (n) 以 及 观察 到 的 数据 y(n) ,用 递 推算 法 得 到 所 有 的 TL) Oe ren sg 
an) URPO PUPU) 
3. 基于 Kalman 滤波 的 水 印 检测 
假设 插入 水 印 后 的 图 像 信号 为 
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Vij = Qij Wi; T Zij (7-40) 
这 里 ,yi 为 水 印 化 的 图 像 的 特征 数据 :ziv A IAR RPE CH s w, AN EK EA F sai, 
H AER RA P HE RARE. ESS A = EP). MEAR A y 中 提取 
HH ZK EN (或 者 商标 )w;,; 的 估计 值 多 ;,;。 为 了 讨论 的 方便 ,我 们 将 以 上 的 各 二 维 序列 分 别 转 
换 成 一 维 序列 向 量 的 形式 ,并 将 式 (7-36) 转 换 为 式 (7-41) 的 形式 ,如 下 。 
Vn = a,W, +2, (7-41) 
MK ERIE a Be P fi TT tee A BY 7k ER fa 5 o H 4 ORE J ee BR AE A RS, BY x; = 
Vn) ,将 式 (7-37) 作 为 检测 系统 的 观测 方程 。 而 对 于 版 权 所 有 者 ,原始 w, 是 已 知 的 ,所 
以 可 以 得 到 式 (7-22) 中 的 过 程 方程 为 
W, = Foni Wr (7-42) 
其 中 , 令 式 (7-26) 的 过 程 噪声 v (2) = 0. 
在 Kalman 过 程 方程 和 观测 方程 中 ,状态 转移 矩阵 F(Cz2 一 1) 和 观测 矩阵 C(n) 是 已 
知 的 ,而 在 水 印 检测 中 ,这 两 个 参数 可 通过 水 印 的 产生 算法 和 上航 人 算法 获得 。 对 于 真正 的 
版 权 者 ,显然 是 已 知 的 。 
水 印 的 育 检 测 要 求 在 检测 端 不 提供 原始 图 像 数据 ,可 提供 水 印 的 参考 序列 。 在 已 知 
参考 序列 的 情况 下 ,状态 转移 和 矩阵 可 通过 式 (7-42) 立 即 获 得 , 即 
Fanai = ww, (7-43) 
2B WL WU FEE, AEK ED KI ik A BE AT UA ZS FP. AE AS A 8 Dt I RY T AL F ,这 
we SEF LRA AE tk A BUE AA BE ABS TT A BY s FR FE eH i BG HE HK ER el), MO HE 
供 权 值 ,根据 式 (7-41) 可 得 


Xn = V。 一 AnWn (7-44) 
从 式 (7-44) 可 看 出 ,这 无 异 于 提供 了 原始 的 图 像 数 据 ( 但 这 里 需要 说 明 的 是 ,这 种 情 
况 和 提供 原始 图 像 数据 还 是 有 根本 区 别 的 ,因为 在 这 些 数据 中 并 没有 含有 它们 采样 于 原 
始 图 像 的 确切 位 置信 息 ) 。 为 了 解决 该 问题 ,使 得 Kalman 预测 能 够 在 水 印 估 计 中 的 条 件 
成 立 ,在 模拟 实验 中 用 权 值 向 量 a, 的 统计 均值 a RE a, 这样 ,在 预测 时 就 不 需要 提供 
an, ,而 只 提供 其 统计 特性 ,也 使 得 递 推 算法 得 到 简化 。 对 于 版 权 所 有 者 来 说 ,o。, 的 统计 特 
生 在 此 时 相当 于 他 /她 的 密 钥 的 一 部 分 。 
显然 ,采用 以 上 处 理 将 会 带 来 水 印 估 计 的 误差 ,但 只 要 能 够 将 误差 控制 在 一 定 范围 
内 ,这 种 办 法 就 是 可 行 的 。 在 我 们 的 模拟 试验 中 给 出 了 估计 误差 。 最 后 ,根据 Kalman jg 
波 检测 原理 ,可 以 得 到 水 印 估计 如 下 。 
Wn = Fai Wri + Hy wi eF nn Wn) (7-45) 
均 方 误差 最 小 条 件 下 的 Kalman 增益 方程 为 
H= Parla Pea) (7-46) 
这 里 ,cz Hin ERA H HR RAGE E. SESE LE, TER W HA AY) , 1B a E WE 
测 数 据 以 及 参考 水 印 序列 求 得 。 假 设 原 始 的 图 像 数 据 和 水 印 参 考 序列 是 统计 独立 的 ,由 
式 (7-41) 求 w AY A FAX eK% , 则 


oy, = 0,0 . + oz, (7-47) 
进 步 9 
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5 (7-48) 
式 (7-46) 中 的 Po Ay sh 7-49) EAR 
Po) F284 fe aa (7-49) 
而 P, 的 迭代 如 下 
P, = (I— H,„a) P’, (7-50) 
如 同 式 (7-35) 中 P(n) 的 定义 ,在 水 印 检 测 中 ,P， 的 定义 如 下 
P, = E{LW, — w, LW, — wv, ]*} = ELW, ] (fol 


将 式 (7-51) 一 式 (7-54) 的 递 推 结果 代 人 式 (7-45) 就 可 估计 出 通 人 的 水 印信 和 号 。 


4. 版 权 商 标的 恢复 
重新 排列 Kalman 滤波 估计 出 的 上 衣 人 人 水印 ,构成 一 二 维 向 量 多 ,对 多 进行 道 映射 
如 下 。 
w < (AKT Ww (7-52) 
将 we FA AEE E — ad h BY R a (EL. BY aJ SR AY Fh o 
另 一 种 对 商标 的 恢复 方法 为 可 考虑 用 A CR) 对 多 DEFT ARS BD 
w <ALi(k) w’ (7-53) 
式 (7-53) 是 对 商标 的 恢复 ,具有 很 重要 的 意义 。 这 种 情况 下 ,检测 端 提供 的 映射 参数 
和 原始 能 入 的 参数 不 同 , 但 它们 之 间 是 对 应 的 。 因 为 从 前 面 的 讨论 可 知 , 这 种 映射 为 有 限 
域 的 自 同 构 映 射 ,能 够 构造 出 这 样 的 “ 公 钥 对 ”。 


7.5 实验 结果 


JE 512X512 大 小 的 Plane 和 Lanna 图 像 上 进行 模拟 实验 ,选择 YAHOO! H yt 
制 的 水 印 商 标 , 其 大 小 为 40X140。 瞬 人 之 前 , 先 使 用 商标 混沌 映射 将 其 在 空间 域 中 置 
AL ,映射 参数 取 R=11,N=188,n=87, 40K 7-7 所 示 。 显 然 , 从 图 7-7(b) 中 的 图 案 很 难 推 
要 而 选 : 
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(a) 原始 的 版 权 商 标 (b) 症 乱 后 的 商标 
图 7-7 原始 商标 及 其 置 乱 
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图 7-8 是 利用 模糊 箭 在 图 像 上 对 特征 的 检测 结果 。 从 图 7-8(a)、(b) 的 检测 结果 可 以 
看 出 ,模糊 炉 的 确 反 映 了 图 像 中 存在 的 不 定性 ,在 图 像 的 平坦 区 域 测 得 的 炉 值 很 小 ,而 在 
边缘 和 纹理 变化 强烈 的 地 方 , 模 糊 炉 相对 大 得 多 ,这 可 以 通过 检测 结果 证 明 。 使 用 模糊 焙 
的 目的 主要 是 找到 图 像 中 存在 的 这 些 变性 比较 大 的 地 方 , 这 些 地 方 的 变化 对 人 的 感觉 刺 
激 相 对 不 敏感 ,有 利于 水 印信 息 的 艇 入 。 


T kes 


(a) Plane 上 的 模糊 烟 检 测 结 来 (b) Lanna 上 的 模糊 燃 检 测 结 来 
图 7-8 利用 模糊 炉 在 图 像 上 对 特征 的 检测 结果 


图 7-9(a) 、b) 是 将 水 印 的 能 人 权 值 从 全 局 统一 放大 在 干 倍 ,以 反映 水 印 在 图 像 的 特 
征 区 域 的 租 入 分 布 效 果 。 水 印 的 舱 入 基于 图 像 的 8X8 分 块 的 DCT 的 中 频 系 数 。 从 两 幅 
图 像 的 水 印 化 效果 可 以 看 出 ,水 印 的 租 入 区 域 正 是 模糊 业 显 车 的 地 方 , 而 在 平坦 的 区 域 ， 
或 者 说 图 像 像 素 变化 不 强烈 的 区 域 , 则 相对 很 少 , 甚 至 不 可 能 能 入 到 这 些 地 方 。 并 且 , 同 
样 是 这 些 区 域 , 水 印 的 明 瞳 强度 也 是 不 同 的 ,主要 因为 ,在 对 水 印 通 人 强度 处 理 中 ,使 得 水 
印 的 强度 依赖 于 图 像 内 


3 


(a) FEMA 对 图 像 特 征 的 提取 效果 (b) 水 印 在 图 像 中 的 分 布 
图 7-9 FEMA 对 图 像 特 征 的 提取 效果 及 水 印 在 图 像 中 的 分 布 


7-10 反映 了 全 局 调整 因子 * 和 PSNR 的 关系 ,从 图 7-10 中 可 以 看 出 : 4 越 大 ， 
PSNR 的 值 越 小 ,水 印 对 图 像 的 改变 越 大 。 反 之 越 小 。 图 7-10 也 从 另 一 个 方面 提供 了 一 
个 从 构造 脆弱 性 水 印 到 鲁 棒 性 水 印 PSNR 随 调整 因子 变化 的 参考 表 。 从 试验 中 可 以 知 
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IS SA RBA A 


道 , 当 X 宇 0. 4 时 ,图 像 已 有 明显 的 假象 存在 。 当 4 二 0.3 时 ,水 印 的 加 入 是 无 感觉 ,再 小 的 
权 值 ,可 能 就 属于 构造 脆弱 性 水 印 的 范围 。 这 里 以 Plane 为 例 , 取 4 二 0.3( 归 一 化 像素 
(EL) ,这 是 通过 实验 观察 保证 水 印 容量 最 大 和 视觉 不 失真 的 最 佳 全 局 调整 因子 。 


m PSNR vs. Weight 天 系 曲 线 


PSNR/dB 


Ey 0.2 0.3 04 05 06 07 


权 值 调整 因子 


| -Œ Plane 
LT Lanna 


| : | SB | : 


0.8 0.9 | 


7-10 全 局 调整 因子 1 和 PSNR 的 关系 曲线 


图 7-11 为 水 印 化 的 Plane 亮度 图 像 ,从 中 可 以 看 出 ,这 和 原始 的 亮度 图 像 没 有 任何 


感觉 上 的 差异 。 


7-11 水 印 化 的 Plane 亮度 图 像 


图 7-12 是 相关 检测 的 结 采 。 从 水 印 化 的 图 像 中 首先 提取 出 特征 系数 ,然后 和 参考 的 
水 印信 息 进 行 相关 。 这 里 是 将 二 维 置 乱 的 参考 水 印 首 先 转换 成 一 维 的 参考 序列 。 可 以 看 
出 , 当 参 考 的 序列 和 瞬 人 的 水 印 相关 时 ,会 出 现 峰 值 ,否则 不 会 有 峰值 出 现 ,或 者 相关 性 非 


常 小 。 


利用 Kalman 滤波 器 对 租 人 的 水 印信 息 进 行 提 取 时 ,将 会 出 现 误差 。 图 7-13 给 出 了 
在 加 噪 的 情况 下 ,滤波 器 的 检测 误 码 率 与 信 噪 比 之 间 的 关系 。 
7-14 给 出 了 JPEG 压缩 下 PSNR 的 变化 情况 ,试验 中 使 用 了 4 幅 静 态 图 像 ,分别 
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相关 峰值 
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图 7-13 Kalman 滤波 器 在 加 品 下 的 误 码 率 检 测 


30 40 #50 60 70 80 9%0 100 
压缩 率 JPEG/% 


图 7-14 JPEG 压缩 与 PSNR 的 关系 
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是 Air plane, Lanna, Tree, Pepper. RRHH: 在 JEPG 不 同 因 子 压 缩 下 ,所 有 图 像 的 变 
化 表现 出 的 趋势 大 体 一 致 。 水 印 化 的 图 像 在 JPEG 因子 下 降 到 35dB 时 ,开始 出 现 明 显 的 
退化 状态 。 

图 7-15 给 出 了 中 值 滤波 和 PSNR 的 变化 情况 ,试验 中 仍然 使 用 了 4 幅 静 态 图 像 。 结 
果 表 明 : 在 不 同 阶 数 滤波 下 ,所 有 图 像 的 变化 表现 出 的 趋势 大 体 一 致 。 水 印 化 的 图 像 在 
阶 数 到 达 5 阶 时 ,开始 出 现 明 显 的 退化 状态 。 
中 值 滤波 与 PSNR 的 关系 曲线 


28 r | _ 
| ate Peper | 


: |= Lanna 
| © Aie plan 
Lt Tree 


PSNR/dB 


中 值 滤 波 阶 数 /NN 
图 7-15 ”中 值 滤波 与 PSNR 的 关系 


比较 下 面 提出 的 水 印 方案 和 文献 L144-145j 中 提出 的 基于 HVS 的 水 印 方案 ,这 里 需 
要 说 明 一 下 ,我 们 只 是 采用 了 文献 中 的 对 水 印 权 值 的 算法 ,并 没有 采用 文献 中 的 伪 随 机 信 
号 代替 水 印信 息 。 本 方案 中 ,直接 使 用 商标 置 乱 形成 水 印信 号 ,水 印 的 检测 采用 Kalman 
滤波 的 方法 ,而 不 是 采用 原 方 案 中 的 利用 直方 图 的 统计 检测 的 方法 。 为 了 讨论 方便 ,约定 
用 FEMA+ VAR 代表 本 方案 ;用 RAND 十 HVS 代表 原始 的 基于 HVS 模 型 的 水 印 方 案 ; 
用 FEMA 十 HVS ARH FEMA 和 HVS 方案 结合 的 水 印 方案 。 男 外 ,商标 的 恢复 统一 
使 用 提出 的 基于 FEMA 十 VAR 的 水 印 检测 方案 , 答 主 图 像 选 择 Plane. 

图 7-16(a) 中 给 出 了 水 印 化 图 像 在 不 同 的 JPEG 压缩 量化 因子 下 的 相关 系数 的 检测 
结果 。 

首先 ,对 水 印 化 的 图 像 进行 JPEG 压缩 ,可 以 看 出 水 印 化 的 图 像 在 JPEG 因子 35% 以 
上 时 ,3 种 算法 的 检测 结果 基本 趋 于 一 致 。 在 低 的 JPEG 因子 压缩 情况 下 ,FEMA 十 VAR 
明显 好 于 其 他 两 种 方法 。 在 压缩 因子 低 于 30% 时 ,水 印 化 的 图 像 已 出 现 明 显 的 失真 , 但 
利用 Kalman 预测 以 及 恢复 的 商标 有 效 。 图 7-16(b) 是 JPEG 因子 为 45%% 时 的 商标 恢复 。 

其 次 ,对 水 印 化 的 图 像 通 过 中 值 滤波 恬 的 滤波 ,如 图 7-17 和 图 7-18 所 示 。 图 7-17 
(a) 是 不 同 阶 数 下 中 值 滤 波 后 的 各 个 方法 的 检测 结果 , 当 滤 波 更 阶 数 小 于 3 时 ,3 种 方法 
基本 一 致 , 阶 数 高 于 3 时 ,FEMA 十 VAR 方案 的 检测 性 能 优 于 HVS 方案 ,而 FEMA + 
VAR 算法 性 能 优 于 RAND 十 HVS 算法 。 图 7-17(b) 是 中 值 滤 波 阶 数 为 4 时 的 商标 
恢复 。 

最 后 ,水印 化 图 像 经 过 了 加 噪声 处 理 。 图 7-18(a) 是 加 高 斯 (Gaussian) 噪 声 情 况 下 ， 
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飞机 图 厂 的 JPEG 系 妆 


E TF {} 全 Q B. B; C |T Q T00 } 


AFIOO 


Peo 2O; - 


O- FEMA+VAR 
> FEMA+HVS 
| + RAND+HVS 


40 50 60 70 80 90 100 
Fe 4a BY Jet E A 
(a) JPEG 压 缩 与 相关 系数 关系 曲线 (b) JPEG 因 子 为 45% 时 的 商标 恢复 


图 7-16 JPEG 压缩 下 的 检测 结果 


飞机 图 片 的 滤波 系数 
tC} 4 7 1 
0.9 À 
1 4 E E, E \ a A A OON EE 
S, VÉ 
Zos An YAHOO! 
= | | 
0.3 | -Cr FEMA+VAR | en o ER Bene | 和 | 
37 FEMA+HVS i 
02| L RAND+HVS | 
0.1 po || | 
l 2 3 4 5 6 f 8 
中 值 滤波 
(a) 中 值 滤波 与 相关 系数 的 关系 曲线 (b) 中 值 滤 波 阶 数 为 4 时 的 商标 恢复 


图 7-17 中 值 滤波 下 的 性 能 检测 


不 同 信 噪 比 下 的 相关 系数 的 检测 情况 。 加 入 噪声 后 ,滤波 器 的 检测 性 能 较 其 他 信和 号 处 理 
要 好 ,这 可 能 是 加 入 的 噪声 和 水 印信 号 不 相关 的 缘故 。 在 信 噪 比 达 到 30dB 左右 时 ,水 印 
化 的 图 像 有 明显 的 视觉 下 降 。 而 在 30dB 2 F, FEMA + HVS 方法 的 性 能 要 优 。 
图 7-18(b) 为 SNR=30dB 情况 下 商标 的 恢复 。 

对 水 印 化 图 像 的 另 一 类 重要 的 攻击 类 型 是 几何 处 理 。 下 面 对 提 出 的 水 印 方案 以 及 文 
献 L144-145] 中 的 方案 进行 抗 几 何 攻 击 检 测 。 我 们 只 对 常见 的 几 种 攻击 方法 进行 分 析 和 
比较 ,结果 如 下 所 述 。 

图 7-19(a) 为 剪裁 情况 下 相关 系数 的 变化 。 采 用 FEMA+ HVS 方法 的 检测 性 能 要 
优 于 其 他 两 种 方法 。 从 原理 上 讲 ,FEMA 十 HVS 方法 采用 的 是 一 个 空间 域 的 “ 稀 朴 ” 映 
射 。 对 水 印 化 图 像 的 章 裁 ,只 能 部 分 影响 商标 的 回复 信息 。 图 7-190 b) 2 FEY RK 40% 
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(a) SNR 与 相关 系数 的 关系 曲线 (b) SNR=30dB 情 帝 下 商标 的 恢复 
图 7-18 加 了 噪 情 总 下 的 检测 绪 采 


况 下 ,Kalman 滤波 恢复 的 商标 图 像 。 
图 7-19(a) 为 缩放 情况 下 的 相关 系数 的 检测 结果 。 采 用 FEMA 十 HVS 方法 的 检测 

性 能 要 好 于 采用 FEMA 十 VAR 方法 。 图 7-19(b) 是 在 将 水 印 化 的 图 像 剪 切 40% WY Kal- 

man 滤波 恢复 出 的 商标 图 像 。 

飞机 图 片 受 到 的 剪 切 攻击 _ 
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图 7-19 AK Els BY H Be Wl a FR 


图 7-20 为 水 印 抗 缩 放 检 测 结果 。 7-21 Ca) 为 旋转 情况 下 相关 系数 的 变化 。 采 用 
FEMA 十 HVS 方法 的 检测 性 能 好 于 采用 RAND 十 HVS 和 FEMA+ VAR 方法 。 图 7-21(b) 
是 将 水 印 化 的 图 像 旋 转 15 时 商标 的 恢复 效果 。 
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(b) 放大 3 售 时 商标 的 恢复 效 示 


(b) 诈 村 15 时 商标 时 恢复 效 未 
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在 MPEG-2/4 的 视频 压缩 编 公 标准 下 ,提出 了 基于 视频 序列 动态 特征 的 水 印 方案 。 
利用 图 像 模 糊 粹 和 帧 图 像 的 局 部 变化 确定 水 印 的 舱 入 权 值 ,这 种 方案 理论 上 不 依赖 HVS 
的 方法 。 因 此 ,构造 的 水 印 方 案 对 基于 HVS 的 MPEG 压缩 编码 是 鲁 棱 的 。 


8.1 视频 压缩 编码 流程 


如 图 8-1 所 示 ,MPEG-2 流 具 有 分 层 的 语法 ,从 顶端 到 末端 连续 的 结构 中 ,Video JF 
列 被 分 成 多 个 图 像 组 (GOPs) ,一 个 GOP 由 多 个 单 帧 图 像 组 成 ,而 图 像 则 由 一 个 或 几 个 
片 组 成 ,每 一 片 包 售 一 个 或 多 个 宏 块 ,由 4 个 亮度 块 (Y) 和 两 个 色 度 块 (U,V) 组 成 ,8 像 
素 X8 像素 的 块 是 编码 的 基本 单元 。 在 Y.U、V 块 上 进行 DCT, 通 过 使 用 可 变 长 编码 进 
行 编码 ,时间 相关 性 通过 从 其 他 运动 补偿 的 帧 中 预测 而 得 到 ,预测 的 误差 用 来 编码 。 
MPEG-4 标准 则 建议 基于 对 Video 对 象 的 描述 ,MPEG-4 认为 每 一 场景 由 Video 的 对 象 
组 成 ,可 通过 对 对 象 的 运动 、 纹 理 和 形状 等 特征 描述 。 运 动 估 计 、 纹 理 编码 和 在 MPEG-2 
中 对 任意 形状 对 象 的 自 适 应 编码 原理 一 样 。 


-一 视频 序列 一 一 


一 一 一 一 一 一 一 图 像 组 一 一 一 一 一 一 | 


和 


图 像 
m 
l i = 


8 像素 


it SH 2 


Sy 
on, 


8-1 MPEG-2 比特 流 从 视频 序列 层 到 块 级 的 分 层 结构 
对 于 静止 图 像 ， MPEG-4 采用 零 树 小 波 算法 (Zerotree Wavelet Algorithm), 以 提高 


压缩 比 , 同 时 还 提供 多 达 11 级 的 空间 分 辨 率 和 质量 的 可 伸缩 性 。 对 于 运动 视频 对 象 的 
编码 ，MPEG-4 采用 了 如 图 8-2 所 示 的 编码 框图 ,以 文 持 对 象 的 编码 。 
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任意 形状 帧 运动 纹理 运动 纹理 
编码 编码 | 加 
il 
流 


ja 
a 
预测 3 


运动 估计 


形状 编码 


图 8-2 MPEG-4 编码 框图 
O 。 预测 编码 和 运动 估计 


8.2.1 预测 编码 


预测 编码 分 帧 间 预 测 编 码 和 帧 内 预测 编码 。 在 预测 编码 时 ,传输 的 并 不 是 像素 的 亮 
度 抽样 值 本 号 ,而 是 这 个 抽样 值 的 预测 值 与 实际 值 之 间 的 差 值 。 对 这 个 预测 误差 进行 量 
化 后 再 编码 ,这 种 预测 编码 方式 叫 差 分 胀 冲 编 码 调 制 (Differential Pulse Code Modula- 
tion, DPCM), 

帧 内 编码 : 编码 图 像 分 块 后 直接 进行 DCT. 随后 使 用 量化 矩阵 (Quantization 
Matrix) 进行 量化 处 理 , 以 缩小 数值 的 动态 区 域 。 由 于 量化 后 的 数据 是 二 维和 矩阵 的 形式 ， 
所 以 还 需 将 二 维 数据 扫描 成 一 维 数据 ,最 后 再 进行 可 变 长 编码 (YLC) ,生成 编码 比特 流 
TRAP AE o 

帆 间 编码 : 视频 信号 经 过 运动 估计 和 运动 补偿 后 ,由 运动 矢量 和 参考 帧 生成 当前 帧 
的 预测 图 像 ,而 后 将 当前 帧 与 预测 图 像 的 残 差 图 像 进 行 DCT、 量 化 、 扫 描 和 VLC 编码 , 生 
成 编码 比特 流 送 和 缓冲 需 。 

8.2.2 运动 估计 和 运动 补 作 

由 于 相 邻 帧 之 间 存 在 着 时 间 宛 余 性 和 帧 内 空间 宛 余 性 ,传送 视频 图 像 时 ,如 果 将 每 帧 
图 像 的 所 有 像素 全 部 传送 ,就 会 产生 很 多 重复 数据 ,也 就 是 元 余 信息 ,造成 存储 空间 的 浪 
费 和 传输 速率 的 降低 。 如 果 只 将 物体 的 运动 信息 传送 到 接收 端 ,接收 端 根据 前 一 帧 的 图 
像 信 息 和 当前 帧 的 运动 信息 更 新 出 当前 帧 ,这样 传 送 的 数据 量 就 少 了 很 多 , 而 关键 技术 是 
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如 何 确定 图 像 物 体 的 运动 信息 ,我 们 将 这 一 过 程 称 为 运动 估计 (MotionEstimation ,ME) ， 
表达 方式 称 为 运动 矢量 (Motion Vector,MV ) 。 运 动 估 计 快 匹配 原理 如 图 8-3 Pra. 


Target Reference 


MV 
图 8-3 ”运动 估计 快 匹配 原理 


类 似 于 以 前 的 视频 编码 标准 ,VOP 也 有 3 种 编码 格式 : TVOP、P-VOP、B-VOP , 表 
AX VOP 的 运动 补偿 类 型 不 同 。 

运动 估计 的 过 程 是 通过 块 匹 配 完 成 , 块 匹 配 运动 估计 研究 包括 块 形状 与 大 小 、 块 匹配 
准则 、 搜 索 精 度 .搜索 起 点 预测 .搜索 策略 .算法 评定 指标 等 几 个 方面 。 目 前 , 块 形 状 与 大 
小 以 及 块 匹 配 准则 已 经 有 了 比较 一 致 的 选择 ;而 搜索 策略 的 选择 最 复杂 , 它 决 定 了 一 个 算 
法 性 能 的 好 坏 , 因 此 ,一直 是 块 匹配 运动 估计 研究 的 主要 方向 。 


8.2.3 块 的 形状 与 大 小 


块 匹 配方 法 基于 这 样 的 假设 : 同一 块 内 像素 的 运动 是 一 致 的 。 显 然 , 这 个 假设 具有 
一 征 的 片面 性 ,但 选择 合适 的 块 形 状 与 大 小 可 在 一 定 程度 上 消除 这 种 片面 性 。 一 般 来 说 ， 
在 块 形状 的 选用 上 ,正方 形 是 比较 目 然 的 选择 ,这 样 既 便于 图 像 的 划分 ,又 有 利于 块 匹 配 
准则 函数 的 计算 。 关 于 块 的 大 小 ,显然 划分 得 越 小 , 残 差 就 越 小 ,但 这 使 得 编码 效率 降低 
了 ，, 块 越 小 , 越 不 能 充分 利用 图 像 的 空间 相关 性 ,所 要 编码 的 运动 天 量 也 越 多 ,如 图 8-4 
所 示 。 


16x16 16x8 8x16 BX 
| 
_ 图 全 BS 十 
| 
Bx8 8x4 4xX8 4x4 


图 8-4 宏 块 及 子 宏 块 的 分 割 


最 新 的 视频 压缩 标准 H. 264 中 , 宏 块 可 划分 成 从 16X16 到 4X4 不同 尺 寸 的 子 块 ， 
如 图 8-4 所 示 。 当 选择 比较 大 的 块 ( 如 16X16.、16X8、8X16) 进 行 编码 时 ,意味 着 块 类 型 
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选择 所 用 的 比特 数 减 少 以 及 需要 发 送 的 运动 矢量 较 少 ,但 相应 的 运动 补偿 误差 较 大 ,因而 
需要 编 公 的 块 残 差 数 据 较 多 ; 当 采 用 较 小 的 子 块 (如 4X4、4X8、8X4) 进 行 编码 时 ,一 
宏 块 需要 传送 更 多 的 运动 矢量 ,同时 子 块 类 型 选择 所 用 的 比特 数 增加 ,比特 流 中 宏 块 涉 信 
息 和 参数 信息 占用 的 比特 数 大 大 增加 ,但 是 运动 估计 更 加 精确 ,运动 补偿 后 的 残 差 数据 编 
码 所 用 的 比特 数 减 少 。 因 此 ,编码 子 块 大 小 的 选择 对 于 压缩 性 能 有 比较 大 的 影响 。 一 般 
来 说 ,大 尺寸 子 块 比较 适 于 图 像 中 灰 度 均匀 区 域 ,而 小 尺寸 块 适 于 有 较 多 细节 的 区 域 。 


8.24 块 匹 配 准 则 


块 匹 配 准 则 -" “是 判断 块 相似 程 度 的 依据 ,因此 匹配 准则 的 好 坏 直接 影响 了 运动 信 
计 的 进度 。 田 一 方面 ,匹配 运算 复杂 度数 据 读 取 复杂 度 很 大 程度 上 取决 于 所 采用 的 块 匹 
配 准则 。 因 此 ,提高 运动 估计 算法 的 速度 有 两 种 途径 : 一 种 是 减少 搜索 匹配 的 点 数 ; 另 外 
一 种 是 降低 块 匹 配 准则 的 计算 复杂 度 。 常 用 的 块 匹 配 准 则 有 以 下 几 种 。 
(1) 均 方 误差 函数 MSE. 
MSE(dz, dy) = es, Sins E REEE ET (8-1) 


tO am 1 y=1 


式 (8-1) 是 计算 相 邻 帧 对 应 矩形 区 域 (XXY) 内 的 最 小 均 方 误差 ,以 MSE 值 最 小 为 最 
优 匹 配点 ,其 中 一 jp 三 dzx, dy 三 p,p 为 允许 的 最 大 位 移 ,X、Y 为 宏 块 尺寸 ,匹配 函数 值 为 
块 失 真 度 (BDM) ,I(x，y，, DEI t 时 刻 点 上 (x，y) 的 像素 值 。 这 是 一 种 非 线 性 测量 ,外 
较 好 地 跟踪 图 像 的 协 方差 模型 。 
(2) 绝对 平均 误差 图 数 MAD, 
MAD(dz, dy) = FYD | Ilx, y,t) — Ilx + dzy +dyst—r)| (8-2) 


Are 


式 (8-2) 是 最 简单 的 匹配 准则 函数 ,用 它 计 算 相 邻 帧 间 的 绝对 平均 误差 ,以 MAD 值 
最 小 为 最 优 匹 配点 。 
(3) 归 一 化 相关 函数 NCCF。 


x Y 
b292 | Ilx,y,t)— Ilx +dz,y+dy,t—r) | 


NCCF(dz, dy) = ; (8-3) 


> YP ary | PUCE 
1 y 一 1 z=1 y 一 1 
以 NCCF 值 最 大 为 最 小 函数 MME 
MME (dz, dy) = max | Ilx, y,t)— Ilx +dz,;y +dy,t—r) | (8-4) 
绝对 误差 和 SAD 
X Y 
SAD(dz, dy) = >, >, | Iæ, yt) — I(x + dz, y +dy,t—r) | (8-5) 
z=1 y=1 


实验 表明 ,MSE 匹配 函数 运动 估计 的 精度 最 高 ,但 其 众多 的 乘 方 运算 在 VLSI 实现 
比较 困难 , MAD 匹配 函数 略 差 ,但 其 相对 人 徐 单 的 运算 易于 在 VLSI 中 实现 ;MME DO ite ek 
数 过 于 简单 ,没有 充分 利用 匹配 块 所 包含 的 特征 信息 ,使 运动 估计 的 精度 大 大 降低 。 相 对 
言 ,只 有 MAD 准则 函数 比较 实用 ,一度 得 到 广泛 的 应 用 。 
ii 


隐 窖 的 原理 及 应 用 


SAD 准则 出 现 后 ,迅速 取代 MAD 被 各 种 运动 估计 算法 采用 ,因为 它 与 MAD 的 匹配 
效果 等 价 ,使 得 计算 量 大 大 降低 。 这 是 因为 : 一 方面 , 它 不 需 乘 法 运算 ,实现 简单 方便 ; 田 
一 方面 ,在 计算 SAD 的 过 程 中 , 当 发 现 块 的 部 分 SAD 已 经 大 于 当前 SAD 时 ,可 以 中 途 退 
出 ,从 而 大 大 减 小 计算 量 。 


8.2.5 ”像素 搜索 精度 


在 视频 序列 中 , 帧 与 帧 之 间 的 真正 位 移 并 非 总 是 像素 尺寸 的 整数 倍 。 如 果 可 以 获得 
亚 像素 精度 的 运动 矢量 , 则 可 以 提高 运动 预测 的 精度 。 对 于 1/2、1/4 像素 精度 预测 ,由 于 
在 参考 帧 中 不 存在 这 些 位 置 的 像素 值 ,因此 需要 采用 周围 的 像素 差 值 计算 。 


826 ”初始 搜索 点 的 选择 


(1) 直接 选择 参考 帧 的 (0,0) 位 置 。 这 种 方法 简单 ,但 容易 陷 人 局 部 最 优点 。 如 果 采 
用 的 算法 初始 步 长 太 大 ,而 原点 又 不 是 最 优点 ,又 可 能 使 快速 搜索 跳出 原点 周围 可 能 比较 
大 的 区 域 而 去 搜索 远 距 离 的 点 ,导致 搜索 方向 的 不 确定 性 , 故 有 可 能 陷 人 局 部 最 优 。 

(2) 选择 预测 的 起 点 。 相 邻 块 之 间 具 有 很 强 的 相关 性 ,以 预测 点 作为 搜索 起 点 。 大 
量 的 实验 证 明 预 测 点 更 徘 近 最 佳 匹 配点 ,使 得 搜索 次 数 减 少 。 序 列 图 像 的 运动 矢量 在 空 
间 和 时 间 上 具有 很 强 的 相关 性 ,特别 使 属于 同一 对 象 的 块 运动 保持 一 致 的 可 能 性 更 大 ,这 
时 夺取 相 邻 块 的 运动 矢量 预测 搜索 起 点 ,会 使 得 中 心 偏 移 更 加 集中 。 


”8.3 搜索 策略 


搜索 策略 中 选择 得 恰当 与 否 对 运动 估计 的 准确 性 和 算法 效率 都 有 很 大 的 影响 。 

8.3.1 全 搜索 法 

全 搜索 (Full Search ,FS) 法 是 对 搜索 范围 内 所 有 可 能 的 候选 位 置 计算 SADC, j) WY 
值 ,从 中 找 出 最 小 SAD, 其 对 应 的 偏 移 量 即 所 求 运动 矢量 。 此 算法 虽 简 单 . 可 靠 , 找 到 的 
必 为 搜索 范围 内 的 全 局 最 优点 ,但 计算 量 大 ,占据 了 整个 编码 大 约 80% 的 计算 量 , 很 难 用 
于 实时 应 用 ,如 图 8-5 Bras. 


8.3.2 三 步 搜索 法 


三 步 搜索 (TSS) 法 得 名 于 它 原来 的 三 步 搜索 ( 搜 索 窗 口 为 十 7 时 ), 当 搜索 窗口 变 大 
时 , 步 数 就 不 止 三 步 了 。 它 是 一 种 由 粗 到 精 的 搜索 算法 ,快速 而 且 高 效 。 三 步 搜 索 算法 实 
现 简 单 ,由 于 收敛 迅速 ,很 快 就 能 结束 搜索 过 程 。TSS 在 视频 会 议和 可 视 电 话 中 应 用 极 
多 ,但 是 搜索 过 于 粗糙 ,由 于 初始 步 长 为 2”'! ,因此 很 容易 一 开始 就 跳出 最 优 匹 配 可 能 性 
比较 大 的 区 域 , 到 偏离 最 优点 很 远 的 地 方 搜索 而 陷入 局 部 最 优 。 但 三 步 搜 索 算 法 缺少 对 
现实 视频 序列 的 中 心 偏 置 特性 的 考虑 ,新 三 步 搜 索 算 法 (New Three-Step Search, NTSS) 
在 这 方面 做 了 改进 ,从 而 获得 比 三 步 搜索 算法 更 好 的 性 能 ,如 图 8-6 所 示 。 
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图 8-5 ”全 搜索 算法 示意 图 


8.3.3 ”新 三 步 搜 索 法 

新 三 步 搜索 法 与 三 步 搜索 法 的 不 同 之 处 在 于 : 改进 了 原 有 三 步 搜 索 法 第 一 步 中 搜 
索 固 定 9 个 点 的 方法 ,采用 了 基于 中 心 偏 置 的 新 搜索 模式 ; 四 对 静态 子 块 或 者 准 静 态 子 
块 的 搜索 引入 了 中 途 停止 的 功能 。 通 过 对 经 典 视频 序列 的 实验 得 出 ,在 一 系列 连续 的 视 
频 帧 中 ,大 部 分 的 块 都 有 静态 性 和 缓慢 运动 特性 ,因此 在 新 三 步 搜索 法 的 第 一 步 运算 时 ， 
对 搜索 窗口 中 心 相 邻 的 8 个 点 也 同时 做 了 匹配 运算 ,这 样 对 慢 速 运动 的 物体 可 以 很 快 地 
找到 与 之 匹配 的 块 。 新 三 步 搜索 法 利用 运动 矢量 的 中 心 偏 置 特 性 ,采用 了 具有 中 心 倾向 
的 搜索 点 模式 ,并 使 用 中 止 判 别 技术 减少 搜索 次 数 , 如 图 8-7 所 示 。 

由 于 安 块 的 中 心 偏 置 特性 在 现实 中 普遍 存在 ,通常 情况 下 只 匹配 很 少 的 点 即 可 完成 
搜索 。 中 心 倾向 的 搜索 点 模式 不 仅 提高 了 匹配 速度 ,而 且 减 少 了 艇 人 局 部 极 小 的 可 能 性 ; 
而 采用 中 止 判别 技术 则 大 大 降低 了 搜索 复杂 度 ,提高 了 搜索 效率 。 
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图 8-7 新 三 步 搜 索 法 示意 图 


834 四 步 搜索 法 


现实 世界 的 物体 既 会 有 小 范围 的 移动 ,也 会 有 大 范围 的 运动 ,因此 ,在 考虑 块 匹 配 算 
法 时 , 既 要 照顾 块 的 中 心 偏 置 特性 ,也 要 兼顾 块 的 大 范围 运动 特性 。 四 步 搜 索 (Four-Step 
Search,FSS) 法 在 两 种 情况 下 都 能 得 到 较 好 的 特性 。 四 步 搜 索 法 首先 用 5X5 的 搜索 窗 
口 ,每 一 步 将 搜索 窗口 的 中 心 移 向 最 小 快 失 真 (MBD) 点 处 , 且 后 两 步 搜索 窗 的 大 小 依赖 
于 最 小 块 失真 点 的 位 置 , 如 图 8-8 所 示 。 
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图 8-8 四 步 搜索 法 可 能 的 搜索 位 置 


8.3.5 基于 块 的 梯度 下 降 搜 索 法 


基于 块 的 梯度 下 降 搜 索 法 (Block-Based Gradient Descent Search,BBGDS) 利 用 运动 
矢量 中 心 分 布 特性 ,在 搜索 过 程 中 使 用 3X3 搜索 窗口 。 视 频 帧 内 相 邻 像素 间 具 有 渐变 
性 ,每 一 步 的 最 小 块 失 真 点 分 布 具有 一 是 的 方向 性 , 即 梯度 下 降 方向 。 基 于 块 的 梯度 下 降 
搜索 法 使 用 梯度 下 降 方 回 决定 下 一 步 的 搜索 方向 ,如 图 8-9 所 示 。 

图 8-9 表示 了 基于 块 的 梯度 下 降 搜 索 法 的 搜索 过 程 。 在 每 一 步 搜索 过 程 中 ,基于 块 
的 梯度 下 降 搜索 法 引入 梯度 下 降 的 概念 ,用 梯度 下 降 的 方向 指导 搜索 方 回 ,对 该 方向 进行 
重点 搜索 ,从 而 减少 和 避免 了 不 必要 的 搜索 ,大 大 降低 了 算法 的 复杂 度 。 
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图 8-9 ”基于 块 的 梯度 下 降 搜索 法 


836 BREAK 


ZER (Diamond Search,DS) 法 最 早 由 Shan Zhu 和 Kai-Kuang Ma 两 人 提出 ,后 
经 过 多 次 改进 ,已 成 为 目前 快速 匹配 算法 中 性 能 最 优异 的 算法 之 一 ,现在 已 被 MPEG-4 
国际 标准 采纳 并 收入 验证 模型 。 

基于 这 两 点 事实 ,区 形 搜索 法 采用 了 两 种 搜索 模板 ,分 别 是 有 9 个 检测 点 的 大 萎 形 搜 
索 模 板 (Large Diamond Search Pattern,LDSP) 和 有 5 个 检测 点 的 小 麦 形 搜索 模板 (Small 
Diamond Search Pattern, SDSP) ,如 图 8-10 Prax. 


a 
a 5 m 
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= E ka 
E | 
| 
图 8-10 搜索 法 的 两 种 搜索 模板 
在 萎 形 搜索 法 过 程 中 ,大 奢 形 模板 被 重复 使 用 , 直到 最 小 块 失真 点 出 现在 中 心 点 。 然 


后 搜索 模式 由 大 委 形 模板 转换 为 小 变形 模板 ,进入 最 后 的 搜索 阶段 。 在 小 萎 形 模板 的 5 
个 检测 点 中 ,出 现 最 小 块 失 真 点 的 位 置 就 确定 了 运动 天 量 , 如 图 8-11 所 示 。 
到 形 搜索 法 的 特点 在 于 它 分 析 了 视频 图 像 中 运动 矢量 的 基本 规律 ,选用 了 大 小 两 种 
形状 的 搜索 模板 : 大 稳 形 搜索 模板 和 小 缕 形 搜索 模板 。 先 用 大 稳 形 搜索 模板 进行 搜索 ， 
Fa 
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图 8-11 ”菱形 搜索 法 搜索 过 程 示意 图 
由 于 步 长 大 ,搜索 范围 广 ,因此 可 进行 粗 定位 ,使 搜索 过 程 不 会 陷 人 局 部 最 小 ; 当 粗 定位 结 
束 后 ,可 以 认为 最 优点 就 在 大 萎 形 搜索 模板 周围 8 个 点 所 围 的 萎 形 区 域内 ,这 时 再 用 小 萎 
形 模板 准确 定位 ,使 搜索 不 至 于 有 大 的 起 伏 , 所 以 它 的 性 能 优 于 其 他 算法 。 另 外 ,菱形 搜 
索 法 搜索 时 各 步骤 之 间 有 很 强 的 相关 性 ,模板 移动 时 只 需 在 几 个 新 的 检测 点 处 进行 匹配 
计算 ,所 以 也 提高 了 搜索 速度 。 
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的 视频 水 印 大 体 上 分 为 以 下 5 种 方案 ,如 图 8-12 示 。 
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图 8-12 视频 组 入 的 几 种 方案 
(1) 水 印 直接 能 人 在 原始 视频 码 流 中 。 此 类 方案 的 优点 是 : 水 印 租 入 的 方法 比较 
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多 ,很 多 数字 图 像 水 印 方案 都 可 以 应 用 于 此 。 缺 点 是 : 会 增加 视频 码 流 的 数据 比特 率 ; 经 
过 MPEG-2 压缩 后 会 造成 水 印信 息 的 丢失 ;高 的 视频 压缩 率 会 降低 图 像 的 质量 。 

(2) 水 印 能 人 在 编码 阶段 (DCT、 DFT、DWT) 的 等 变换 域 的 系数 中 。 此 类 方案 的 优 
点 是 : 水 印 仅 能 入 在 系数 的 量化 中 ,不 会 增加 视频 流 的 数据 比特 率 ; 易 设计 出 抗 多 种 攻 
击 的 水 印 。 缺 点 是 : 会 降低 视频 的 质量 ,因为 一 般 它 也 有 一 个 解码 .和 做人、 再 编码 的 

(3) IKEDA HR AA DCT 量化 编码 相 结 合 。 这 种 方案 一 般 多 是 构造 脆弱 性 的 方案 。 
其 优点 是 : 容易 和 编 / 纠 错 码 相 结合 。 缺 点 是 : BREE. 

(4) 水 印 直 接骨 入 在 MPEG-2 压缩 比特 流 中 。 此 类 方案 的 优点 是 : 没有 解码 和 再 编 
码 的 过 程 , 因 而 不 会 造成 视频 质量 的 下 降 ,同时 计算 复杂 度 低 。 缺 点 是 : 由 于 压缩 比特 率 
的 限制 而 限定 了 徐 人 水 印 的 数据 量 的 大 小 。 

(5) 被 加 的 水 印信 号 大 小 依赖 于 对 未 水 印 化 和 水 印 化 序列 的 运动 补偿 的 差分 估计 。 
尽管 视频 的 比特 流 因 加 水 印 必 须 被 分 解 而 且 水 印 必 须 进行 DCT ,但 是 该 方法 不 要 求 完 全 
的 解压 缩 和 再 压缩 。 该 方案 的 鲁 棒 性 尚 竺 证明 。 
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于 Video 具有 的 数据 量 大 ,在 具体 的 应 用 中 往往 将 图 像 序 列 以 压缩 编码 的 方式 进 
行 存 储 和 传输 ,因此 ,相关 的 视频 水 印 必须 针对 具体 的 压缩 标准 进行 算法 设计 ,同时 还 期 
望 具备 以 下 许多 不 同 的 特征 。 
不 可 视 性 : 能 人 在 Video 中 的 水 印 必须 是 感官 察觉 不 到 的 。 
安全 性 : 算法 公开 ,在 正确 的 参数 未 知 的 情况 下 ,对 水 印 的 删除 是 不 可 能 的 。 
鲁 棒 性 : 在 压缩 的 和 未 压缩 的 Video 流 上 通过 有 意 或 无 意 对 水 印 的 处 理 是 不 可 能 
的 。 与 此 同时 ,显著 降低 视觉 质量 将 影响 其 商业 价值 ,这 些 操 作 包 括 加 入 信和 号 、 滤 
复杂 性 : 水印 及 水 印 恢 复 理论 上 要 具有 低 的 复杂 性 。 如 采 水 印 用 于 跟踪 ,每 一 接 
收 者 对 于 水 印 的 提取 必须 简单 ,如 果 水 印 是 用 在 Video "Pik AFAR BITS A ft R 
标 ARA AI m RA EREDTEK Video 序列 中 。 为 了 解决 对 水 印 的 各 种 可 能 
的 攻击 ,算法 的 复杂 度 要 低 。 
抗 压缩 处 理 : 数字 Video 通常 会 以 压缩 的 形式 发 送 或 转 存 (例如 在 请 求 服务 右上 ， 
或 者 在 万 维 网 服务 副 上 ), 这 样 对 骨 入 在 压缩 的 Video 流 中 的 水 印信 息 将 是 一 个 


严峻 的 考验 ， 
恒定 的 比特 率 : 在 比特 流 中 加 入 水 印 不 能 增加 整个 视频 传输 的 比特 率 ,至 少 应 符 
合 通信 传输 带宽 的 要 求 ， 


由 于 具体 的 应 用 目的 及 环境 的 不 同 , 以 上 对 视频 水 印 的 不 同 要 求 在 具体 的 水 印 方案 
中 有 可 能 不 需要 同时 满足 ,这 几 种 要 求 在 某 些 情况 下 存在 着 折 中 ， 
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“8.6 视频 水 印 通 入 方案 


我 们 仅 在 工 帧 中 加 和 水印 ,是 由 于 工 帧 是 Video 流 中 最 显著 ,也 是 最 重要 的 帧 。 因 为 
1I.B、P 之 间 的 关系 ,IT 帧 的 水 印 将 扩散 到 B 和 P 帧 中 。 攻 击 者 如 果 将 所 有 Video 流 中 的 
I 帧 变 弱 ,的 确 可 以 将 水 印信 号 从 Video 中 删除 。 但 如 果 了 帧 的 信号 变 弱 ,B 或 者 P 帧 的 
质量 将 严重 下 降 。 而 在 工 帧 中 , 仅 在 亮度 的 8 关 8 块 中 加 入 水 印 , 因 为 亮度 信号 比 其 他 两 
个 色 度 信号 强 得 多 。 其 次 ,加 水 印 开始 于 原始 的 数据 流 中 ,可 以 预 设 一 种 MPEG 的 编码 
码 流 格式 ,将 水 印 通 人 在 所 选 定 帧 中 的 DCT 块 的 中 频 AC 系数 中 。 

在 本 书 的 方案 中 ,首先 对 原始 Video 序列 的 内 容 进 行 分 析 , 在 基于 MPEG 编码 格式 
的 图 像 流 中 ,对 所 有 工 帧 图 像 的 动态 进行 检测 ,选择 变化 大 的 序列 帧 图 像 舱 和 人 水印 ;利用 
混沌 映射 将 水 印 商 标 在 空间 域 上 进行 置 乱 , 然 后 将 置 乱 的 水 印 商 标 分 块 租 入 在 选择 的 相 
应 图 像 的 DCT 分 块 系数 中 ,这 样 ,攻击 者 对 水 印信 息 的 预测 是 困难 的 ;通过 提取 图 像 的 
模糊 炉 测 度 准 确 描 述 Video 图 像 中 适合 信息 隐藏 的 显著 特征 ,利用 图 像 模糊 和 帧 图 像 
的 局 部 变化 确定 水 印 的 租 入 权 值 。 对 水 印 商 标的 检测 ,不 需要 原始 的 序列 数据 ,利用 
Kalman 滤波 预测 能 入 的 信息 ,从 而 使 商标 得 到 很 好 的 恢复 ,以 表明 产品 的 版 权 。 该 方案 
基于 MPEG-2 压缩 标准 ,但 是 也 可 应 用 于 其 他 的 混合 编码 方式 中 。 


8.6.1 水 印 商 标的 产生 及 骨 入 


在 文献 L171j 中 ,作者 提出 用 不 相关 的 伪 随 机 噪声 (PN) 和 矩阵 和 参考 的 水 印 图 案 相 乘 ， 
不 管 是 PN 和 矩阵 ,或 者 是 租 入 的 水 印 ,在 接收 端 是 知道 的 。 值 得 注意 的 是 ,对 于 Video JF 
列 的 每 一 帧 水 印 都 是 相同 的 ,而 PN 矩阵 是 不 同 的 ,这 保证 商标 的 空间 位 置 在 不 同 的 帧 不 
同 ,从 而 保证 水 印 的 安全 性 。 男 一 种 常用 的 方法 是 将 用 户 ID 或 者 商标 在 空间 域 上 转换 成 
扩 频 信号 ,然后 再 能 人 Video 中 ,这 种 方案 在 原理 上 和 文献 L169 中 的 方法 基本 相同 。 在 
本 方案 中 ,水 印 商 标 是 通过 第 3 章 介 绍 的 空间 域 的 混沌 映射 的 方法 产生 的 ,混沌 映射 的 参 
数 & 可 以 被 看 作用 户 的 私 钥 。 经 过 和 迭代 置 乱 后 的 商标 在 空间 域 上 要 比 原 始 商标 大 得 多 ， 
但 基本 的 像 泰 数 一 样 。 因 此 ,商标 的 置 乱 上 映射 可 以 被 看 作 空间 域 上 的 一 个 “ 玻 ” 上 映射, 由 于 
Video 可 供 租 入 的 像素 很 多 ,考虑 将 置 乱 后 的 商标 从 空间 域 上 可 以 分 成 硅 干 小 的 子 块 , 这 
些 子 块 的 数量 可 根据 要 伐 人 的 视频 序列 的 具体 特点 , 单 帧 图 像 能 够 携带 的 信息 量 以 及 压 
缩 率 等 因素 确定 。 水 印 商标 的 产生 及 藤 和 人 如 图 8-13 所 示 。 


8.6.2 序列 帧 图 像 的 动态 特征 检测 


一 帧 图 像 中 运动 的 分 布 情况 : 运动 程度 在 视频 质量 评价 过 程 中 起 着 重要 的 作用 。 运 
动 矢 量 描述 了 当前 帧 宏 块 与 上 一 帧 最 相似 图 像 块 之 间 的 偏 移 ”” 。 可 以 利用 各 宏 块 运动 
矢量 的 长 度 定义 一 帧 图 像 中 运动 的 分 布 情况 。 

令 [Azx (i,， j), AmG, PIRRBkMPRRG, j) 的 运动 矢量 。 那 么 ,该 宏 块 的 运 
动 程度 用 式 (8-6) 定 义 。 
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-视频 序列 Im 
-一 一 一 一 图 像 组 一 一 一 一 ~ 


| | | 一 8 像素 一 


图 8-13 JK ED Rate TRAE Rete A 
1 

Pa PPR 

H , Amma RINIA D) R ERA P BERKE., + AS Ki A RY H Ae oh EE 

Ai 由 式 (8-7) 和 定义 。 


Ama Cis, 7) =1+ JAxiGs, j) + Ayi, j) (8-6) 


Aue = >) Ama Gs i) (8-7) 
其 中 ,Nwas 表 示 一 由 图 像 中 的 宏 块 个 数 。 
各 帧 的 运动 分 布 : 基于 两 帧 误差 ,就 是 利用 两 帧 之 间 的 绝对 误差 帧 描述 一 帧 图 像 的 
运动 程度 。 
S Li(m,n) 表 示 第 k& 帧 中 像素 (m,n) 的 腕 度 值 。 第 & 帧 中 宏 块 (i,j) 的 运动 程度 可 用 
式 (8-8) 定 义 。 
Aws =i OY |L — La m,n) | (8-8) 


N, (m,n) € blockli, j) 

运动 较 剧烈 的 清晰 度 对 整 段 视频 清晰 度 的 页 献 较 弱 。 因 为 运动 剧烈 ,所 以 人 有 眼 可 能 
分 辨 不 出 该 帧 中 太 多 的 细节 。 因 此 ,在 帧 图 像 序列 中 能 人 水 印 ,需要 对 帧 序列 的 每 一 帧 图 
像 中 以 及 帧 图 像 中 之 间 的 运动 进行 检测 ,从 人 有 眼 的 视觉 特征 讲 , 在 这 些 运 动 较为 剧烈 的 部 
分 巾 中 应 该 租 入 相对 比较 多 的 水 印信 息 ,水 印 的 强度 相对 更 大 。 而 对 具体 的 一 帧 图 像 , 其 
特征 的 检测 可 参考 第 3 章 对 图 像 特征 的 检测 。 实 际 上 ,模糊 烂 反 映 了 图 像 像 素 之 间 的 变 
化 程度 。 也 可 以 说 ,图 像 的 一 些 特征 分 布 明 显 的 区 域 , 诸 如 纹理 .边缘 区 域 或 者 活动 性 强 
的 区 域 的 模糊 业 值 较 大 ,将 水 印信 息 租 入 在 这 些 区 域 有 利于 提高 水 印 的 鲁 棒 性 。 


8.6.3 水 印 的 能 入 步骤 


C1) 对 原始 的 序列 进行 动态 特征 分 析 , 利 用 8. 6.2 节 的 式 (8-6) 和 式 (8-7), 对 所 有 编 
码 结 构 中 的 工 帆 的 运动 特性 进行 排序 , 找 出 动态 变化 大 的 图 像 作为 水 印 化 的 帧 。 每 一 帧 
中 图 像 的 变化 程度 可 参考 式 (8-8) 。 
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(2) 考虑 一 幅 I 帆 的 亮度 信号 { 广 [Lma ’ n | ,1=1,2, M ,由 MAK)DPAN,X N: 
的 单 帧 图 像 六 La » zj 组 成 ,用 wei? Lk, k] RRE k WLP Pr Be A BY 7K ENA 

(3) 将 film. m lorie AA BH 8X8 的 图 像 块 BY Cu, v),u, v=1,2,°++,8; 
& 一 1,2,…，N。 六 是 能 分 成 块 的 个 数 , FA A FEY I TE A EP RY OH 
进行 统计 检测 ,水 印 只 嵌入 在 模糊 炳 大 的 块 中 。 设 置 门限 r 及 水 印 标志 位 685 ,检测 Rs， 
E Rs >r M bP 一 1 否则 OP 二 0 。r 的 值 可 以 根据 嵌入 的 信息 量 自 适 应 地 调整 、 

(4) AAC Ga, vw) =DCTLB? Cu, v) | RNB i WARP B Cu, v) RH DCT A 
Wo Urs w =1,2,",8 ;u,v 二 1,2,…,8 ;k 王 1,2,…, N。 将 置 乱 的 水 印 商 标 W 分 成 许 
多 4 X4 大 小 的 子 块 ,各 个 子 块 按 顺 序 分 别 租 入 在 不 同 帆 中 的 b =1 的 DCT 系数 块 中 ， 
水 印 权 值 的 确定 可 参考 4. 2. 5 节 , 得 到 的 权 值 乘 以 模糊 入 的 值 ,上 骨 经 过 全 局 因子 调整 加 权 
相应 的 水 印信 息 , 形 成 水 印 化 的 系数 Ci Cans v1). 

(5) 用 Ce sv AAE Bi (u,v) ,然后 进行 DCT 的 逆 变 换 ,将 逆 变 换 的 块 进行 重新 
排列 形成 水 印 化 的 图 像 块 FPL one |, 而 所 有 水 印 化 的 巾 以 及 没有 水 印 化 的 帧 形成 了 加 
水 印 的 Video 序列 。 


8.6.4 水 印 的 检测 与 提取 


水 印 的 检测 与 序列 的 重新 解码 和 重 构 相 结合 ,如 图 8-14 编码 的 比特 流 经 VLC 解码 
后 ,将 能 人 的 水 印 的 那些 特征 系数 输入 到 Kalman 滤波 器 中 ,滤波 器 的 另 一端 是 由 用 户 提 
供 的 参考 序列 ,经 过 预测 滤波 恢复 出 每 一 帧 中 的 水 印 ,这 些 水 印 块 可 形成 重 构 的 商标 。 在 
没有 原始 数据 的 情况 下 ,对 于 Video 水 印 的 检测 ,利用 Kalman 预测 对 艇 入 的 水 印信 和 号 进 


行 滤波 。 
k, 
版 权 商标 参考 序列 Tee 
Bb ny Aw — Em 商标 
~ 


aa 

Vi. pee a. 0*°*~C~C*é‘“‘“‘CS‘S SS OR? 

m 辅助 信息 oe 
EFFY aeg 
运动 天 量 


二 一 帆 预 测 一 一 


运动 补偿 


图 8-14 ”水印 的 提取 流程 


商标 的 重 构 基 于 滤波 右 从 水 印 化 的 序列 中 对 骸 入 的 置 乱 信 息 的 检测 估计, 从 每 一 水 
印 化 的 帆 中 检测 出 租 入 的 部 分 商标 的 信息 , 按 顺 序 将 各 个 帧 中 的 信息 午 新 排列 ,形成 混乱 
的 商标 图 像 w ,利用 映射 Aw'(k) 对 w 中 的 空间 坐标 进行 迭代 道 映射 回 原始 位 置 ,相应 位 
置 的 像素 值 进行 交换 。 
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87 模拟 试验 结果 


用 两 个 QCIF 格式 的 Susie 和 Claire Video 序列 进行 实验 ,图 像 的 大 小 为 144 X176 
像素 ,整个 水 印 的 通信 及 检测 算法 基于 图 像 的 8X8 像素 分 块 ,选择 YAHOO 作为 二 进 
制 的 水 印 商 标 , 其 大 小 为 40 X140 像素 。 租 人 之 前 , 先 使 用 商标 混沌 映射 将 其 在 空间 
域 中 置 乱 ,映射 参数 取 & 二 11,NN 一 240,n 王 87 ,获得 置 乱 的 商标 的 大 小 为 240 X 240 像 
FA ,这 里 将 240X240 像 系 的 商标 分 成 60X60 像 泰 大 小 的 于 商标, 这样 总 共 可 分 成 16 个 
于 商标 ,将 这 16 个子 商标 分 别 舱 入 在 Video 序列 的 16 个 工 帧 图 像 中 。 而 在 每 一 帧 图 像 
的 8X8 像素 的 分 块 中 ,只 改变 其 中 的 16 个 中 频 AC 系数 的 值 ,这 16 个 像素 对 应 的 坐标 
为 (3 一 6 ,3 一 6) ,在 一 帧 图 形 中 需要 225 个 8X8 像素 的 分 块 , 而 一 帧 图 像 最 多 可 能 的 分 块 
为 176X144/(8X8) 王 352 ,在 352 块 中 选择 225 块 嵌入 水 印 。 为 了 构造 鲁 棒 性 的 水 印 ， 
A FERR A A M E KR A EHR HRA K ER ,算法 中 的 门限 值 可 根据 衣 人 水 印 的 比特 数目 适 
应 调节 。 

图 8-15 为 原始 的 水 印 商 标 及 置 乱 后 的 水 印 商标 。 在 没有 原始 映射 参数 的 情况 
下 , 想 从 图 8-15(b) 道 映射 回 图 8-15(a) 是 困难 的 ,而 且 知 道 图 8-15(b) 并 不 能 分 辨 出 
8-15(a) 。 


YAHOO 


Peo le O! 


(a) 原始 的 水 印 商 标 (b) 置 乱 后 的 水 印 商标 
图 8-15 原始 的 水 印 商 标 及 置 乱 后 的 水 印 商 标 


图 8-16 为 帆 图 像 的 模糊 炉 及 水 印 的 分 布 效 果 。 图 8-16(a) 为 Susie 序列 中 水 印 化 的 
一 帧 图 像 的 模糊 炉 的 分 布 。 图 8-16(b) 为 在 单 帧 图 像 的 水 印 的 分 布 。 为 了 显示 水 印 分 布 
的 区 域 ,在 实验 中 ,我 们 有 意 放 大 了 水 印 的 舱 入 权 值 , 选 4 二 3, 从 实验 结果 看 ,水 印 明 显 极 
入 在 图 像 的 边沿 及 纹理 变化 强烈 的 地 方 。 

图 8-17 为 水 印 PSNR 及 相关 检测 结果 。 图 8-17(a) 是 两 个 序列 中 水 印 化 各 工 帆 的 
PSNR(dB) 的 值 (4 二 0.3)。 图 8-17(b) 为 两 个 序列 水 印 化 帧 的 相关 系数 的 检测 结果 。 如 
果 提 供 的 水 印 和 图 像 中 的 水 印 不 相关 , 则 系数 范围 0 一 0. 2 随机 分 布 ,而 在 相关 情况 下 , 则 
如 图 8-17(b) 中 的 测试 结果 。 

8-18 是 在 Susie 序列 中 对 水 印 的 相关 峰值 的 检测 结果 ,检测 只 提供 原始 水 印信 息 
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水 印 化 的 帧 序号 
(b) 相关 系数 曲线 


图 8-17 水 印 PSNR 及 相关 检测 结果 


(这 里 可 以 是 置 乱 的 商标 )。 
图 8-19 显示 了 水 印 化 对 各 种 帧 图 像 市 来 的 影响 。 在 MPEG-2 的 Video 通用 压缩 编 
码 格 式 下 ,因为 P 帧 和 B 帧 都 是 从 了 巾 中 预测 而 来 ,在 IT 帧 加 入 水 印 引 起 的 图 像 的 失 玻 
肯定 会 引起 相关 帧 图 像 的 失真 。 由 图 8-19 可 看 出 ,预测 的 关系 对 各 帧 带 来 的 误差 不 完全 
相同 ,而 且 相 关 图 像 的 失真 是 累积 的 。 
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图 8-18 ”相关 峰值 的 估计 
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D 


图 8-19 水 印 化 序列 帧 的 平均 误差 


图 8-20 是 采用 Kalman 滤波 器 对 舱 入 的 水 印信 息 的 检测 ,商标 的 恢复 和 重 构 基于 滤 
波 屁 的 输出 结果 。 实 验 中 ,我 们 在 水 印 化 的 序列 中 加 入 了 30dB 噪声 ,检测 重 构 的 水 印 商 
标 如 图 8-20(a) 所 示 。 为 了 检验 在 加 噪 情况 下 水 印 商 标的 检测 效果 ,我 们 在 水 印 化 的 序列 
中 加 入 了 一 是 的 高 斯 噪声 , 信 噪 比 和 检测 错误 率 的 关系 如 图 8-20(b) 所 示 。 


x10 


[时 -估计 的 logo 的 误 码 率 与 高 斯 信 噪 比 | 


= 
man) 
0 2 4 6 8 10 12 14 16 18 20 
SNR/dB 
(a) Kalman 检测 结果 (SNR=30dB) (b) 加 Gaussian 噪声 后 的 BER 


图 8-20 Kalman 滤波 结果 
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图 8-21 为 航 裁 及 压缩 后 的 结果 。 对 于 帧 剪裁 和 丢失 的 情况 ,我 们 从 水 印 化 的 帧 中 删 
除 3 thot. ,而 用 随机 数 代 替 ,其 水 印 恢复 的 结果 如 图 8-21(a) 所 示 。 商 标的 恢复 依然 可 见 , 其 
原因 是 ,在 我 们 的 方案 中 ,原始 商标 映射 后 分 块 分 别 艇 入 在 Video 序列 中 ,对 单 帧 的 删除 ， 
只 能 部 分 删除 商标 信息 ,因此 本 方案 是 抗 帧 剪裁 和 丢失 的 。 

在 大 多 数 应 用 场合 ,数字 Video 涉及 存储 及 传输 BEA H Video 序列 进行 有 损 压 
缩 和 编码 。 为 了 检验 MPEG 压缩 编码 对 水 印 的 影响 ,我 们 采用 MPEG-2 默认 的 基于 
HVS 的 量化 门限 乘 以 3/4 因子 对 水 印 化 的 Video 序列 进行 量化 和 Huffman 编码 ,相应 
的 压缩 比率 (CR) 为 5.6 :1, 然 后 另存 .解压 缩 。 图 8-21(b) 为 压缩 后 的 水 印 化 Video FF 
列 中 的 一 帧 图 像 ,此 时 图 像 中 水 印 是 无 感觉 的 ,水 印 商标 依然 可 检测 。 将 恢复 的 水 印 序列 
在 专用 的 播放 器 中 播放 ,其 效果 和 原始 的 序列 相 比 ,图 像 质 量 没 有 明显 差别 。 


(a) 帧 剪裁 后 商标 的 恢复 (b) 压缩 后 的 7 帧 图 像 
图 8-21 BY RR Aa AR 
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第 9 前 , 
T ERAS IR yh He CAS Ba ek 


摘要 : 本 章 给 出 了 一 种 基于 中 文 同 义 词 蔡 换 的 隐藏 算法 ,详细 介绍 了 分 词 系统 、 同 义 
词 词 库 的 构建 以 及 同义词 词组 的 编码 算法 ,给 出 了 基于 中 文 同义词 车 换 的 编码 隐藏 系统 。 


91 二 次 剩余 理论 


在 基于 同义词 替换 的 隐藏 算法 中 ,利用 二 次 剩余 随机 选择 将 被 隐藏 的 同义词 ,这样 可 
以 增强 该 算法 的 抗 攻击 能 力 。 在 此 首先 介绍 二 次 剩余 的 定义 。 
定义 9.1 设 交 是 大 于 1 的 正 整数 , 右 同 余 式 
a’ =a(modm) (a.m) = 1 (9-1) 
有 解 , 则 称 a 为 模 的 平方 剩余 (或 二 次 剩余 ); 否 则 称 a 为 模 m 的 平方 非 剩 余 ( 或 二 次 非 
剩余 ) 。 
例如 : za 二 11, 求 出 模 产 的 二 次 剩余 和 二 次 非 剩 余 , 见 表 9-1。 


表 9-1 二 次 剩余 (mod 11) 


由 表 9-1 可 以 看 出 , 模 11 的 二 次 剩余 为 1,3,4,5,9; 二 次 非 剩 余 为 2,6,7,8,10。 

二 次 剩余 理论 中 有 一 个 重要 的 结论 : 在 模 的 一 个 既 约 剩余 系 中 , 恰 有 (mm 一 1)72 
个 模 m 的 二 次 剩余 ,Cm 一 1)/2 个 模 m 的 二 次 非 剩 余 。 也 就 是 说 , 模 m 的 二 次 剩余 和 二 
次 非 剩 余 的 个 数 是 相等 的 ,因此 可 以 采用 二 次 剩余 理论 选取 所 有 竺 隐藏 的 一 个 子 集 , 将 所 
有 结 点 编码 为 0 或 1,0 代表 该 结 点 标记 的 是 模 密 钥 的 二 次 剩余 ,1 代表 该 结 点 标记 的 是 
模 密 钥 的 非 二 次 剩余 ,然后 根据 待 隐藏 位 出 现 的 位 置 上 的 编码 是 0, 还 是 1 选择 该 位 置 上 
的 结 点 是 否 作 为 隐藏 位 。 
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921 分 词 系 统 
在 汉语 的 书面 表达 中 ,单字 是 最 小 的 单位 , 词 与 词 之 间 并 没有 明显 的 界限 标志 。 因 此 ， 


隐 密 的 原理 及 应 用 


在 汉语 文本 分 析 处 理 中 ,分词 是 首先 要 解决 的 问题 。 中 文 分 词 (Chinese Word Segmenta- 
tion) 是 指 将 一 个 汉字 序列 切 分 成 一 个 个 单独 的 词 , 词 的 字数 最 小 为 1, 此 时 为 单字 。 

在 汉语 中 , 字 、 句 和 有 段落 可 以 通过 明显 的 分 界 符 ( 如 标点 、 回 车 等 ) 划 分 ,但 是 词 却 没 有 
一 个 形式 上 的 分 界 符 。 因 此 ,在 以 词 为 单位 的 文本 处 理 就 显得 更 复杂 ,一 个 好 的 分 词 系统 
对 于 文本 处 理 就 显得 尤为 重要 。 目 前 ,分词 的 算法 主要 有 基于 字符 串 匹 配 、 基 于 理解 和 基 
于 统计 的 分 词 3 种 方法 。 

哈尔滨 工业 大 学 信息 检索 研究 中 心 (HIT-CIR) 语 言 技 术 平台 53 是 哈尔滨 工业 大 学 
信息 检索 实验 室 开发 的 一 套 中 文 语言 处 理 平台 ,免费 提供 给 高 校 和 科 人 研 院 所 用 于 科学 人 研 
究 。 它 的 语 料 资 源 主要 来 目 哈 尔 沪 工业 大 学 信息 检索 人 研究 中 心 汉语 依存 树 库 (HIT-CIR 
Chinese Dependency Treebank) 和 哈尔滨 工业 大 学 信息 检索 人 研究 中 心 同义词 词 林 扩展 版 
(HIT-CIR Tongyici Cilin(Extended)); 其 中 的 语言 处 理 模 块 包括 断 句 (Sectence Split- 
ting,SplitSectence) ,语法 分 析 (Lexical Analysis System, IRLAS) .基于 SVMTool 的 词性 
标注 (Part-of-Speech Tagging, PosTag) 、 命 名 实体 识别 (Named Entity Recognition, 
NER) 、 基 于 动态 局 部 优化 的 依存 句法 分 析 (Dependency Parsing, Parser) .全 文 词 义 消 歧 
(Word Sense Disambiguation, WSD) 等 ,涉及 中 文 处 理 的 各 个 领域 ,可 以 达到 很 好 的 分 词 
效果 和 较 高 的 效率 。 本 实验 借助 这 个 语言 技术 平台 以 句子 为 单位 的 处 理 模 块 进 行 分 词 ， 
借助 count 模块 依次 处 理 每 个 分 词 并 进行 统计 与 编码 。 系 统 调用 的 接口 主要 如 下 。 


// 从 句子 创建 DOM 

CreateDOMFromString (const char * ) 

// 调 用 以 句子 为 单位 的 处 理 模块 

int SplitSentence(); 

// 分 词 

int SegmentWord(); 

/ /查看 某 一 个 段落 的 句子 数 ,paragraphIdx 为 段落 号 ,从 0 开始 编号 

int CountSentenceInParagraph (int paragraphIdx); 

/ /查看 第 paragraphIdx 个 段落 中 的 第 sentenceIdx 个 句子 的 词语 数 ,sentenceIdx 为 句子 
// 在 段落 中 的 编号 ,从 0 开始 编号 


int CountWordInSentence (int paragraphIdx, int SentenceIQX) ; 
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1. 同义词 词 库 的 构建 
以 《同义词 词 林 》 为 基础 构建 中 文 同义词 库 。 最 原始 的 《同义词 词 林 》 是 由 梅 家 驹 等 
AE” F 1983 年 编撰 而 成 的 ,初衷 是 对 创作 和 翻译 等 工作 提供 同义词 组 ,后 来 被 用 于 信息 
处 理 中 ,大 大 提高 了 它 的 使 用 价值 。 
这 本 词典 中 不 仅 包 含 了 同义词 组 ,还 包含 了 一 定数 量 的 同类 词 , 即 一 些 具 有 相关 意义 
的 词组 。 为 了 能 更 好 地 将 其 使 用 在 中 文 信息 处 理 中 ,哈尔滨 工业 大 学 信息 检索 研究 室 根 
据 众多 词语 相关 的 资源 对 《同义词 词 林 》 进 行 完善 ,完成 了 《哈尔滨 工业 大 学 信息 检索 研究 
室 同 义 词 词 林 扩 展 版 》, 它 去 除了 原版 中 14 706 个 罕 用 词 和 非常 用 词 ,最 终 包含 77 343 条 
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词语 ,包含 较 原版 而 言 更 丰富 的 语义 信息 。 表 9-2 列 出 了 《同义词 词 林 ) 扩 展 前 后 的 比较 。 
表 9-2 《同义词 词 林 》 扩 展 前 后 的 比较 


词典 特征 扩展 后 扩展 后 
词 条 总 数 /个 小 类 数 /个 1400 
大 类 数 /个 i 
中 类 数 /个 i 


在 (哈尔滨 工业 大 学 信息 检索 研究 室 同 义 词 词 林 扩展 版 ) 中 ,是 以 表 9-3 所 示 方式 存 
储 的 。 它 的 编码 位 是 按照 从 左 到 右 的 顺序 排列 的 。 第 一 位 表示 词 所 在 的 大 类 ,第 二 位 表 
示 词 所 在 的 中 类 ,第 三 位 和 第 四 位 表示 词 所 在 的 小 类 ,第 五 位 表示 词 群 ,第 六 位 和 第 七 位 
为 原子 词 群 ,第 八 位 的 标志 有 3 种 ,分 别 是 “一 ”“#” 和 “@”。 其 中 ,“ 一 ”代表 这 组 词 是 同 
ids“ # ”代表 这 组 词 是 同一 类 词 ,它们 属于 相关 词组 ,但 是 并 非 同义词 ;“@” 代 表 这 组 词 
是 独立 的 词 , 它 在 词 库 中 既 没 有 同义词 ,也 没有 相关 词 , 见 表 9-3。 

表 9-3 同义词 词 林 存 储 方式 


词类 编码 词组 信息 
Aa01A01= ADAH ABR 人 选 
Di09D49 # 报道 组 采访 组 摄制 组 
Bc03B02@ ih Si 


不 同 级 别 的 分 类 结果 可 以 为 自然 语言 处 理 提 供 不 同 的 服务 。 可 以 将 同义词 组 分 为 3 
组 ,分 别 是 完全 可 替换 词组 (语义 完全 相等 的 同义词 组 ) 不 完全 可 替换 词组 (部 分 语义 相 
等 的 同义词 组 ) 和 屠 义 词组 (存在 部 分 语义 不 相等 的 同义词 组 ) ,并 以 此 生成 新 的 词 库 。 现 
根据 本 章 的 研究 特点 对 其 进行 相关 的 改动 ,得 到 本 实验 使 用 的 中 文 同 义 词 词 库 ,具体 构建 
步 又 如 下 。 

(1) 以 《哈尔滨 工业 大 学 信息 检索 研究 室 同 义 词 词 林 扩展 版 ) 为 基础 ,取出 其 中 的 同 
义 词 组 , 即 第 八 位 为 “一 ”的 词组 。 

(2) 将 中 华人 民 共 和 国教 育 部 国家 语言 文字 工作 委员 会 分 别 于 2001 年 和 2002 年 发 
布 的 两 批 异形 词 表 加 和 人 词 库 ,并 删除 重复 出 现 的 同义词 。 

(3) 根据 现代 汉语 词语 的 词 频 ”统计 删除 生僻 的 同义词 。 

(4) 使 用 哈尔滨 工业 大 学 信息 检索 研究 中 心 语 言 技 术 平 台 进 行 分 词 识 别 , 同 时 删除 
在 已 有 词 库 中 不 能 正确 识别 的 词语 。 

(5) 删除 同义词 组 中 所 有 为 单字 的 同义词 。 

(6) 删除 词 库 中 同义词 个 数 为 1 的 同义词 组 。 

2. 同义词 词 库 的 编码 

文本 文档 的 自身 元 余 较 图 像 . 音 频 等 多 媒体 文件 少 得 多 ,在 传统 的 同义词 替换 算法 
中 ,简单 的 用 "1? 代 表 蔡 换 , 用 "0 代表 不 替换 ,其 隐藏 容量 为 1 比特 / 词 , 隐 藏 算法 本 身 对 
蔡 换 词 也 有 要 求 , 显 然 戏 人 容量 过 少 。 我 们 期 望 找到 一 种 能 够 提高 隐藏 容量 的 编码 方式 。 
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最 简单 的 二 进 制 编码 方式 是 等 长 编码 ,但 是 这 种 编码 方式 会 造成 一 定编 码 效 率 的 损 
失 。 本 章 选 择 不 等 长 编码 方式 ,不 但 可 以 增加 通信 容量 ,还 提高 了 编码 率 。 采 用 不 等 长 编 
码 时 ,特别 要 注意 避免 译 码 的 二 义 性 或 多 义 性 。 也 就 是 说 ,在 对 一 个 字符 集 进 行 不 等 长 编 
码 时 ,要 求 任何 一 个 字符 的 编码 都 不 能 是 其 他 字符 编码 的 前 级 ( 即 无 前 级 编码 ) ,这 样 在 接 
收 端 就 不 会 因 歧 义 而 翻译 出 错误 的 信息 。 为 了 使 不 等 长 编码 成 为 无 前 级 编码 ,可 以 利用 
二 义 树 实现 ,具体 方法 见 算法 9.1. 

算法 9.1 同义词 词 库 编码 算法 。 

(1) 获取 某 一 组 同义词 组 中 同义词 的 个 数 , 记 为 n。 

(2) 构建 具有 7 个 叶子 结 点 的 编码 二 又 树 。 

建立 二 义 树 的 根 结 点 , 赋 权 值 为 n。 

@ 建立 该 结 点 的 左 子 结 点 , 赋 权 值 为 | |. 

@ 建立 该 结 点 的 右 子 结 点 , 赋 权 值 为 Ln J. 

@ 重复 外 和 思 ,直到 二 叉 树 的 所 有 叶子 结 点 的 权 值 均 为 1. 

(3) 将 得 到 的 二 叉 树 的 所 有 左 分 支 编码 为 “1”, 所 有 右 分 支 编 码 为 “0” ,以 从 根 结 点 到 
叶子 结 点 的 路 径 上 分 文 编码 组 成 的 码 串 作为 该 叶子 结 点 的 编码 。 

C4) 将 得 到 的 各 个 叶子 结 上 点 的 编码 存 人 长 度 为 革 的 数据 结构 中 ,用 来 保存 各 个 同 

以 “旅馆 ”为 例 , 它 在 同义词 词 库 中 的 同义词 组 为 :“ 旅 馆 旅社 客栈 招待 所 宾馆 旅 
店 ”, 根据 同义词 词 库 的 编码 算法 ,这 是 一 个 具有 6 个 结 点 的 编 公 二 又 树 ,如 图 9-1 所 示 。 


旅馆 旅社 客栈 招 每 所 宾馆 旅店 
| 6 


招待 所 宾馆 旅店 
3 


ZAR 
| 


111 | 110 | 011 010 | 
图 9-1 具有 6 个 结 点 的 编码 二 叉 树 
可 以 看 到 ,编码 二 叉 树 各 叶子 结 点 的 层次 数 之 差 为 1 或 0, 利 用 从 根 结 点 到 叶子 结 点 
的 路 径 分 支 编 码 时 ,同一 组 同义词 中 词语 的 编码 长 度 差 也 是 1 或 0。 这 样 ,在 舱 人 秘密 信 
息 时 ,平均 散人 容量 为 log; n 比特 / 词 ,其 中 为 同义词 组 的 个 数 , 这 样 就 克服 了 一 个 同 义 
词 只 能 编码 一 个 比特 位 的 缺点 ,提高 了 系统 的 隐藏 容量 。 
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931 基于 同义词 替换 的 信息 隐藏 算法 
基于 中 文 同 义 词 替 换 的 隐藏 算法 主要 包括 以 下 5 个 部 分 ,如 图 9-2 所 示 。 


| 文本 文档 分 词 -一 一 一 EAA PR? 一 


”分词 和 标记 | -i 


— eT 
1Y ( c =a | 
_ -一 


—— ”< 一 是 否 为 引用 部 分 7 


同义词 词 库 N 


—_ 


”一 一 是 否 有 同义词 ? 一 一 一 ~ 


序号 |1|12|13|14|15|617|…|， 
zka olill olol]: 
| | ao ia = N 
| A ERNER? 


密 钥 生成 秘密 信息 


<< RAR? 一 一 说 入 失败 | 


a 结束 ) 


图 9-2 ”基于 中 文 同 义 词 替换 算法 的 能 人 模型 


(1) 密 钥 生成 : 能 人 秘密 信息 使 用 的 密 钥 是 由 能 人 密 铀 和 二 次 剩余 密 钥 组 成 的 。 首 
先 ,利用 能 人 密 钥 对 秘密 信息 进行 编码 ,将 其 转换 为 比特 串 ; 然 后 利用 二 次 剩余 密 钥 生成 
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一 个 二 次 剩余 表 , 这 个 表格 主要 是 帮助 我 们 选择 竺 替换 的 候选 词 ,根据 二 次 剩余 密 钥 ,如 
果 一 个 数 为 二 次 剩余 密 钥 的 二 次 剩余 (表示 为 1) , 则 将 这 个 数 对 应 的 词 作为 候选 词 , 反 之 
相反 。 

(2) 分 词 和 标记 : 分 词 和 标记 在 中 文 同 义 词 替换 算法 中 是 必需 的 。 一 个 好 的 分 词 系 
统 对 隐藏 算法 来 说 尤为 重要 ,此 次 选取 的 是 哈尔滨 工业 大 学 信息 检索 人 研究 中 心 语言 技术 
平台 ,该 平台 拥有 丰富 的 中 文 词 库 以 及 多 种 语言 处 理 模 块 , 可 以 达到 理想 的 分 词 效 果 。 

(3) 候选 词 模 型 : 在 分 词 和 标记 之 后 便 可 对 其 中 的 词 进行 替换 ,从 而 磐 人 秘密 信息 。 
候选 词 就 是 被 选中 要 进行 蔡 换 的 词 。 不 能 盲目 选择 候选 词 ,必须 考虑 很 多 因素 ,过 滤 掉 一 
些 不 合适 的 词语 ,如 图 9-2 中 的 候选 词 模型 所 示 。 下 面 对 过 滤 规 则 进行 简单 描述 。 

标点 符号 : 标点 符号 是 固定 的 且 很 难 改变 ,在 本 次 方案 中 不 考虑 标点 符号 。 

长 度 为 1 的 分 词 : 经 分 词 系统 处 理 的 句子 中 ,长 度 为 1 的 分 词 一 般 都 是 代词 ,介词 
或 者 连词 等 ,这 些 词 很 难 或 者 不 可 能 被 替换 ,因此 也 不 予 考虑 这 些 词 。 

© 非 纯 中 文 的 词 : 本 实验 的 研究 内 容 是 针对 中 文 载体 的 ,由 于 在 分 词 系统 中 不 能 识 
别 韭 中 文 的 词 , 如 英语 日语 或 者 一 些 中 英 混 合 词 (如 “TT 恤 ”) 等 ,因此 本 课题 中 不 考虑 如 
何 处 理 这 些 词 的 问题 。 

由 引用 部 分 : 通常 在 文本 中 会 出 现 一 些 引 用 部 分 ,如 书 名 号 , 书 名 号 之 间 的 部 分 往 
往来 自 一 些 特定 用 语 , 如 果 修 改 这 部 分 内 容 , 会 引起 攻击 者 的 注意 ,因此 不 考虑 这 些 词 的 
处 理 问题 。 

@ 没有 同义词 的 分 词 : 没有 同义词 的 分 词 是 不 能 能 人 秘密 信息 的 ,这 些 词 必须 
省 去 。 

虽然 一 些 分 词 有 同义词 ,但 是 它 不 在 二 次 剩余 表 中 。 也 就 是 说 ,这 些 分 词 是 二 次 
剩余 密 钥 的 非 二 次 剩余 ,不 进行 替换 ,这 些 词 也 必须 被 删 去 。 

(4) WAR: 通过 候选 词 模 型 可 以 艇 入 秘密 信息 ,但 是 考虑 到 经 过 同义词 兰 换 后 ,由 
于 上 下 文 语 境 的 不 同 可 能 会 破坏 语义 的 一 致 性 ,在 此 作 预 替换 人 处理。 文献 L174] 提出 了 一 
种 同义词 组 判别 算法 ,有 效 解 决 了 语义 一 致 性 的 问题 。 

(5) 语义 替换 : 这 部 分 将 转化 为 比特 串 的 秘密 信息 族人 隐 密 载体 , 即 文本 文档 中 。 
在 预 蔡 换 中 ,利用 同义词 判别 算法 进行 判断 ,判断 结果 正确 时 即 可 通过 ”与 或 ?运算 租 人 秘 
密 信 息 ; 和 否则 不 做 替换 。 

在 介绍 具体 算法 前 ,首先 进行 如 下 定义 。 

C: 载体 文本 ;M: 秘密 信息 ;S: 能 人 秘密 信息 后 的 文本 ;下 : 密 钥 ;D: 同义词 词 库 。 

算法 9.2 大 基于 同义词 替换 的 信息 隐藏 算法 。 

D 将 秘密 信息 M 编码 成 二 进 制 比特 串 ,再 根据 密 钥 K, 令 K 一 玉 ,采用 3DES( 三 
重 数据 加 密 算 法 的 通称 ,相当 于 对 每 个 数据 块 应 用 3 次 DES 加 密 算法 ) 算 法 ”对 秘密 
信息 M 进行 加 密 ,此 时 M =ECK,DC(K’,ECK,E))). 

D 对 载体 文本 C 进行 分 词 。 

© 利用 密 钥 K 生成 二 次 剩余 密 钥 开 ，。 

遍历 C 中 的 每 一 个 分 词 ,根据 同义词 词 库 D AK: ,利用 候选 词 模 型 判断 该 分 词 是 
否 为 候选 词 ,者 是 , 则 转 @ ,否则 转 @)。 
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第 9 章 自然 语言 文本 隐藏 


© 根据 候选 词 所 在 的 同义词 词组 进行 预 蔡 换 ,利用 同义词 判别 算法 进行 判别 。 

夺 判 别 结 采 为 真 , 则 根据 同义词 词组 的 编码 舱 入 秘密 信息 ; 夺 判 别 结 有 果 为 假 , 则 
HO. 

重复 执行 由 一 @ ,直到 整个 M 全 部 能 人 完成 ,生成 替换 后 的 文档 S, ERRA 


932 基于 同义词 替换 的 信息 提取 算法 


秘密 信息 的 提取 算法 是 内 人 算法 的 道 过 程 。 在 提取 中 不 需要 原始 文本 ,属于 盲 提取 。 
它 与 岁入 算法 不 同 的 是 ,提取 秘密 信息 时 不 用 进行 预 蔡 换 , 也 不 需要 对 同义词 进行 替换 ， 
而 是 需要 将 候选 词 和 编码 后 的 同义词 组 进行 对 比 , 从 而 提取 出 秘密 信息 的 比特 串 。 

算法 9.3 基于 同义词 替换 的 信息 提取 算法 。 

对 和 通 人 秘密 信息 的 文本 S 进行 分 词 。 

D 根据 密 钥 K AM RRR AK, 

O 遍历 S 中 的 每 一 个 分 词 ,根据 同义词 词 库 D 和 Ki, 利 用 候选 词 模 型 ,判断 该 分 词 
是 否 为 候选 词 ,若是 , 则 将 其 与 编码 后 的 同义词 组 进行 对 比 , 恢 复出 秘密 信息 的 二 进 制 比 
特 串 M ,和 否则 跳 过 该 词 继续 处 理 下 一 分 词 。 

@ 重复 执行 四 ,直到 遍历 完 S 中 的 每 一 个 词 。 

© 根据 密 钥 K.S K = 一 K !', 采 用 3DES 解密 ,得 到 秘密 信息 M, M 一 D(K,E(K， 
D(K,M’))). 


93.3 多 载体 模型 中 的 中 文 同 义 词 蔡 换算 法 


在 被 动 攻击 的 情形 下 ,多 载体 模型 较 单 载体 模型 而 言 , 具 有 较 高 的 安全 性 。 在 多 载体 
模型 中 使 用 中 文 同义词 蔡 换 算法 较 单 载体 模型 更 复杂 ,最 重要 的 是 需要 知道 各 个 载体 和 
秘密 信息 之 间 的 对 应 关系 。 本 章 利用 条 件 转移 概率 P 将 分 组 后 的 秘密 信息 散 入 不 同 的 
载体 中 ,以 确定 载体 和 秘密 信息 之 间 的 对 应 关系 ,具体 表示 为 

diag (Cci sCzs***sCa) (Cm, sMo ，… M, ) Pp) ) = (51952 9° Sn) (9-1) 

式 (9-1) 中 的 P; 为 条 件 转移 概率 , 它 是 一 个 nn 阶 方 阵 , 它 的 每 一 行 每 一 列 中 只 有 一 个 

TURN 1 ,其 余 都 为 0,c9 表 示 通 人 运算 ,例如 : 


1 0 pa 

| . 10 0 0 l 

diag | (C1 ves st 94) (m1 ,7722 ,7723 sM, ) 1 

0 0 1 0 

c, CO ms 
= diag an 
cs (CO m 
c C0 ms 

= (S1 So ，S3 9S4) (9-2) 


A (9-2) Bean TEAK A PR PSEA 4 个 载体 ,同时 秘密 信息 被 分 为 4 组 ,根据 条 件 转移 
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隐 黎 的 原理 及 应 用 


概率 Py 将 m mmm GAARA cz 、cs ci、cs 中 。 特 别 地 , 当 P; 为 单位 矩阵 时 ,多 载体 
模型 则 退化 为 单 载体 模型 。 可 以 说 , 单 载 体 模型 是 多 载体 模型 的 一 种 特殊 情形 。 

条 件 转移 概率 P, 由 密 钥 KK 和 载体 个 数 n ERE. P, 的 计算 方法 见 算法 9. 4。 

算法 9.4 P, 的 计算 方法 。 

D 建立 一 个 长 度 为 n 的 数据 结构 ,初始 化 为 连续 的 自然 数 序 列 , 即 O~ n—1, 如 
图 9-3 所 示 。 

Q it LG) 二 hh(K,n,i)=k” * mod n,iEll,n]. 

@ 将 1Q 的 值 与 中 数据 结构 的 值 进行 对 比 ,并 在 相应 位 置 存 人 i YB et a P 
突 , 则 将 i 的 值 存 人 其 后 第 一 个 不 为 空 的 位 置 。 

@ 根据 图 9-3 生成 的 数据 结构 生成 P, Pa 的 第 j Bi; 列 元 素 为 1, 其余 元 素 均 


例如 : R K=7,n=5 时 的 条 件 转移 概率 P; 。 

O 生成 数据 结构 0 一 4。 

@ 计算 LG). 

1(0) =h(7,5,0) 一 75 mod 5 =2; 

1(1) =AC7,5,1) =1; 

1(2) =AC7,5,2) =3; 

1(3) =h(7,5,3) =4; 

1(4) =h(7,5,4) =2; 

根据 计算 的 1() 的 值 将 其 存 人 生成 的 数据 结构 中 ,如 图 9-4 所 示 。 


图 9-4 P; 生成 图 


由 根据 图 9-4 得 到 条 件 转 移 概 率 Ps 。P; 的 第 i 行 第 7 列 对 应 的 位 置 元 素 均 为 1, 其 
余 元 素 均 为 0, 则 有 


0 0 0 0 1 
0 1 0 0 0 
P; = |1 0 0 0 0 
0 0 1 0 0 
0 0 0 1 0 


经 算法 9.4 得 到 P, ,也 就 是 说 ,得 到 了 各 个 载体 与 秘密 信息 之 间 的 对 象 关 系 , 就 可 
以 按照 这 个 对 应 关系 艇 人 秘密 信息 了 。 下 面 介绍 多 载体 模型 中 的 蔡 换算 法 ,如 图 9-5 
所 示 。 
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文本 文档 片段 ci 


SAS CRS Fr Exe 


ELK? ~ 


密 钥 生成 


图 9-5 ”多 载体 模型 的 同义词 替换 算法 的 能 人 模型 


与 9.3.1 节 中 介绍 的 同义词 蔡 换 算法 类 似 , 多 载体 模型 中 的 蔡 换 算法 中 同样 包括 密 
钥 生 成 、 分 词 和 标记 、 候 选 词 模型 . 预 蔡 换 和 语义 替换 五 大 部 分 。 不 同 的 是 ,这 里 的 秘密 信 
息 被 分 为 多 个 秘密 信息 块 ,与 此 同时 ,分 词 是 对 多 个 载体 均 进 行 分 词 ,通过 候选 词 模型 的 
分 词 需 经 过 条 件 转移 概率 P, 将 秘密 信息 预 奉 换 到 不 同 的 载体 中 ,此 时 如 不 影响 上 下 文 
语 境 , 则 和 通 人 秘密 信息 ,得 到 做 人 秘密 信息 的 文档 ,具体 算法 如 下 。 

算法 9.5 ”多 载体 模型 中 的 中 文 同 义 词 蔡 换算 法 。 

DO 将 秘密 信息 M 编码 成 二 进 制 比 特 串 ,再 根据 密 钥 K, S K =K ,采用 3DES 算 
法 对 秘密 信息 M 进行 加 密 ,此 时 M=ECK,DCK ',E(K,M)))。 

@ 将 M 分 为 N 组 ,得 到 mm,iE[1, Nj]。 

将 载体 C 分 为 N 组 ,得 到 ci, ELl N]. 

® 根据 密 钥 K 和 分 组 个 数 N 计算 条 件 转移 概率 卫 , ,由 Pa 得 出 (ic) 并 标记 (7) 
的 配对 情况 。 

© 利用 密 钥 天 生成 二 次 剩余 密 钥 K,- 

对 c 进行 分 词 ,遍历 c 中 的 每 一 个 分 词 ,根据 同义词 词 库 D A K: ,利用 候选 词 判 
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断 其 是 否 为 候选 词 ,在 是 , 则 进行 预 蔡 换 , 否 则 转 @。 
D 如 有 果 通 过 预 蔡 换 , 则 根据 同义词 词组 的 编码 磐 和 人 m EWURO., 
将 了 加 1 转 @ ,直到 所 有 的 M RAZR sjo 
根据 (7 的 配对 情况 得 到 序列 Cs ,ss，,…,s,), 即 宜人 入 秘密 信息 的 文档 S。 


93.4 多 载体 模型 中 的 中 文 同 义 词 提取 算法 


多 载体 模型 在 提取 秘密 信息 的 过 程 中 同样 不 需要 原始 文本 ,提取 时 仍然 是 将 候选 词 
和 编码 后 的 同义词 词组 进行 对 比 , 从 而 提取 出 秘密 信息 的 比特 串 ,但 是 这 里 需要 知道 载体 
的 个 数 NN, 并 根据 载体 个 数 N 和 密 钥 天 确定 载体 与 秘密 信息 之 间 的 对 应 关系 ,具体 算法 
如 下 。 

算法 9.6 多 载体 模型 中 的 中 文 同 义 词 提 取 算 法 。 

-将 S 分 为 N 组 ,得 到 s;, jell NJ. 

D 对 s; 进行 分 词 。 

@ 利用 密 钥 天 生成 二 次 剩余 密 钥 1。 

© 遍历 s 中 的 每 一 个 分 词 ,根据 同义词 词 库 D 和 天 : ,利用 候选 词 模型 ,判断 该 分 词 
是 否 为 候选 词 , 硅 是, 则 将 其 与 编码 后 的 同义词 组 进行 对 比 , 恢 复出 秘密 信息 的 二 进 制 比 
特 串 om; ,否则 跳 过 该 词 继续 处 理 下 一 分 词 。 

根据 密 钥 K 和 分 组 个 数 N 计算 条 件 转 移 概 率 P, ,由 Pa 得 出 Cm;,s;) 并 标记 (i,]) 
的 配对 情况。 

将 7 加 1 转 昌 ,下 到 遍历 完 所 有 的 s;。 

D 根据 (i,7) 的 配对 情况 恢复 出 正确 的 秘密 信息 序列 M= Cm ,ms,… ,mn ) 。 

根据 密 钥 K, 令 K 一 天 ', 对 M 采用 3DES 解密 ,得 到 秘密 信息 的 二 进 制 比特 串 
M,M=D(K,EC(K’,D(K.M’))),%} M 编码 得 到 秘密 信息 。 


94 ”算法 的 性 能 比较 


在 本 章 前 面 几 节 的 讨论 中 ,由 于 考虑 了 上 下 文 语 境 , 基 于 单 载体 的 同义词 算法 已 经 基 
本 消除 了 可 能 产生 歧义 的 同义词 替换 ,这 样 使 替换 后 的 文本 仍然 是 一 个 语法 正确 且 语 义 
连贯 的 文档 。 

在 多 载体 模型 的 中 文 同 义 词 蔡 换算 法 中 ,在 保证 语义 连贯 的 基础 上 ,根据 各 个 载体 和 
分 块 之 后 秘密 信息 间 的 不 同 对 应 关系 通 人 秘密 信息 ,提高 了 系统 的 安全 性 。 

具体 实验 如 图 9-6 所 示 , 其 中 图 9-6(a) 为 原始 文本 ,图 9-6(b)、(c) 分 别 为 在 单 载体 隐 
藏 模型 和 多 载体 隐藏 模型 中 进行 中 文 同 义 词 蔡 换 后 的 截图 。 

为 了 对 比 改进 前 后 两 种 算法 的 同义词 蔡 换 结果 ,分 别 用 两 种 模型 中 的 算法 对 约 1000 
个 文本 进行 了 实验 ,实验 结果 见 表 9-4, 其 中 和 能 人 容量 三 替换 字数 /载体 字数 ;准确 度 王 准 
确 蔡 换 词 数 / 蔡 换 词 数 。 
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文本 隐藏 m 


自然 语 


ES SE 


Béeel een enw etm Xi 


E PENA 
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i ee | Sie 引 igk 
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DRAS RES "o 
2 Se <H REE R 


NE Saar EERENS 
SEE WE e. 


Egemen borers Befa 
六 5 fa | ipsa a= 


(a) 原始 文本 
(c) 2 aA iat 


(b) 单 载体 隐藏 


ran te a ra 
| | SABER KERES HEU 
+ Se Oe cents eaten: 
| cee CESRERE . I 
Hi a a aan 
g eee ee | Sarde 


| AR 
| Bagel. 


E ET 
ce oN 
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6 具体 实验 


图 9 


隐 窖 的 原理 及 应 用 


表 9-4 实验 结果 


类 单 载体 隐藏 ”| 多 载体 隐藏 


载体 字数 二- 05 准确 替换 词 数 78 


可 以 看 出 ,多 载体 模型 的 能 人 容量 提高 了 1. 48% ,替换 的 准确 度 提高 了 6. 16% ,有效 
提高 了 隐藏 模型 的 隐蔽 性 和 重 棒 性 。 
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隐 密 通信 篇 


急 密 通信 篇 以 网 络 环境 为 背景 ,主要 介绍 如 何 利 用 信息 隐藏 技术 解决 数 
字 内 容 的 信息 泄露 问题 ,并 针对 于 机 App 系统 的 个 人 隐私 保护 问题 提出 了 新 
的 思路 ,展示 了 最 新 的 研究 应 用 成 果 。 这 部 分 内 容 第 10 一 12 SHR, HH, 
第 10 章 介 绍 文本 替换 的 隐藏 系统 ;第 11 章 介 绍 基 于 H. 264 视频 压缩 标准 的 
隐 密 通信 ;第 12 章 介 绍 基 于 移动 终端 的 隐 密 系统 开发 。 


= 


I 


摘要 : 所 谓 隐 信 道 , 就 是 在 公开 信 关 中 构造 出 的 一 种 进行 隐藏 通信 的 信道 。 该 信道 
的 存在 仅 为 秘密 通信 的 用 户 所 知 ,而 公开 信道 只 是 作为 隐藏 通信 的 掩护 体 。 

本 章 介绍 一 种 在 互联 网 即时 通信 背景 下 的 秘密 信息 隐蔽 通信 系统 ,目的 是 解决 网 络 
通信 中 敏感 信息 的 保密 传输 问题 。 实 例 中 ,将 通信 信息 的 范围 限制 为 中 文 文本 ,利用 中 文 
同义词 蔡 换 的 隐藏 算法 将 秘密 信息 艇 人 网 络 聊天 会 话 中 ,从 而 使 秘密 信息 安全 地 到 达 接 
收 方 。 


“101 ”系统 的 总 体 设计 


在 即时 通信 背景 下 和 能 人 秘密 信息 和 通 痕 的 在 文本 中 能 人 水 印信 息 的 概念 并 不 相同 。 
通 第 的 艇 人 水 印 的 目的 是 保护 和 认证 能 人 载体 本 喘 内 容 , 而 在 隐蔽 通信 情况 下 ,更 重要 的 
是 秘密 信息 的 保护 问题 ,二 者 侧重 点 不 同 。 男 外 ,在 即时 通信 过 程 中 进行 舱 入 和 提取 时 ， 
收发 双方 需要 密切 合作 ,以 解决 通信 的 起 始 、 结 束 、 同 步 及 校 验 等 问题 。 

即时 通信 背景 下 的 隐蔽 通信 系统 的 体系 结构 可 以 采用 图 10-1 所 示 的 伪 客 户 端 结构 。 


10-1 伪 客 户 端 结构 


在 伪 客 户 痊 结构 的 体系 中 ,抛弃 了 网 络 通 信和 系统 原 有 的 客户 端 ,编写 新 的 客户 并 ,这 
样 可 以 无 缝 集成 信息 隐藏 功能 和 网 络 通信 功能 。 

本 例 中 将 涉及 信息 隐藏 的 各 个 模块 钥 入 在 伪 客 户 端 的 表面 下 。 租 入 端 以 点 对 点 通信 
一 方 的 聊天 语句 作为 单位 载体 ,将 秘密 信息 分 块 后 通过 密 钥 租 入 到 不 同 的 聊天 语句 中 ,并 
在 公开 的 信道 上 发 送 ; 解 析 端 则 通过 密 钥 从 接收 到 的 语句 中 提取 秘密 信息 ,此 时 不 需要 原 
始 载 体 语 句 , 即 采用 下 提取 方式 。 

对 于 攻击 者 而 言 , 在 网 络 信道 截获 的 含 密语 句 表 面 上 与 普通 聊天 语句 并 没有 差别 ,由 
于 不 知道 原始 载体 语句 的 内 容 ,所 以 无 法 察觉 和 获得 秘密 信息 。 系 统 总 体 设计 框图 如 
图 10-2 Bra. 

混合 密 钥 包括 对 秘密 信息 进行 编码 加 密 的 密 钥 天 ,、 在 隐藏 时 使 用 的 隐藏 密 钥 K 和 


隐 窖 的 原理 及 应 用 


同义词 词组 编码 密 钥 天: 。 般 人 时 ,将 需要 秘密 发 送 的 消息 经 过 编码 .加密 、 分 组 等 一 系列 
操作 形成 一 个 二 进 制 码 串 ;网络 通信 双方 在 对 话 过 程 中 生成 聊天 文本 ,通过 中 文 同义词 蔡 
换 将 秘密 信息 形成 的 二 进 制 码 串 舱 入 到 聊天 文本 中 得 到 合 密 文本 ; 合 密 文本 在 公开 信道 
上 发 送 至 接收 方 。 提 取 冰 的 操作 与 发 送 端 完 全 相反 ,这 里 不 再 费 述 。 


同义词 库 


于 


T ON D 
- CD ) 加 密 信息 


图 10-2 系统 总 体 设 计 框 图 
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在 即时 通信 背景 下 ,通信 双方 希望 在 通信 过 程 中 艇 入 秘密 信息 ,基于 网 络 聊天 的 特 
点 ,需要 将 秘密 信息 藤 入 在 多 个 文本 载体 中 。 下 面 介 绍 本 系统 的 详细 设计 。 

10.2.1 帧 结构 的 设计 

在 数据 通信 中 ,数据 链 路 层 把 网 络 层 交 下 来 的 数据 封装 成 帧 (Framing) 发 送 到 链 路 
上 ,以 及 把 接收 到 的 帧 中 的 数据 取出 并 上 交 给 网 络 层 。 在 处 理 过 程 中 ,一 般 都 是 将 原始 比 
特 流 封装 成 离散 的 帧 ,然后 以 帧 为 单位 发 送 ,并 在 帧 内 完成 差错 检测 、 同 步 等 控制 ,如 
图 10-3 所 示 。 

Wi Free 由 结束 


帧 的 数据 部 分 


e pik 


图 10-3 Hbi ý àp A tot BS Er E oT 


封装 成 帧 就 是 在 一 段 数据 的 前 后 分 别 添 加 首部 和 尾部 ,这 样 就 构成 了 一 个 帧 。 帧 长 
等 于 数据 部 分 的 长 度 加 上 帧 首部 和 帧 尾部 的 长 度 , 而 首部 和 尾部 的 一 个 重要 作用 就 是 进 
行 帧 界定 , 它 里 面包 含 了 许多 必要 的 控制 信息 。 而 接收 端 在 收 到 物理 层 上 交 的 比特 流 后 ， 
就 能 根据 首部 和 尾部 的 标记 ,从 收 到 的 比特 流 中 识别 帧 的 开始 和 结束 ,有 效 地 解决 了 同步 
问题 ,如 图 10-3 所 示 。 

在 隐蔽 通信 中 ,由 于 攻击 者 的 存在 ,需要 在 应 用 层 完成 相应 的 操作 ,并 以 帧 的 形式 在 
隐 信 道上 传输 。 在 本 系统 中 ,我们 目 行 定 义 一 种 帧 格式 封装 数据 ,并 以 这 种 帧 格式 为 单位 
进行 信息 传输 。 将 数据 封装 成 帧 时 ,需要 进行 帧 界定 ,可 作 如 图 10-4 所 示 的 设 定 。 
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ezm i L aa a se] 


一 一 


图 10-4 Wt sh 


(1) 标志 (FLAG) 字 段 : 以 唯一 的 01101010 在 帧 首部 起 界定 作用 ,作为 某 一 帧 的 起 
始 标志 。 在 双方 通信 的 过 程 中 ,发 送 方 不 断 问 隐蔽 信道 发 送 消息 ,接收 方 不 断 从 隐蔽 信道 
提取 发 送 方 发 出 的 比特 流 。 当 有 秘密 信息 需要 艇 入 时 ,加 上 标志 字段 表示 开始 租 入 秘密 
信息 。 也 就 是 说 ,在 信道 上 传递 消息 时 , 当 遇 到 标志 字段 时 ,认为 一 帧 秘密 信息 开始 传输 ， 
同样 ,接收 端 也 是 当 遇 到 标志 字段 时 ,开始 提取 秘密 信息 。 

这 里 存在 一 个 问题 ,就 是 01101010 这 个 码 串 可 能 出 现在 原始 消息 中 的 任何 位 置 ,这 
样 就 影响 了 标志 罕有 段 的 判断 。 为 了 解决 这 个 问题 ,采用 了 位 填充 的 方法 ,就 是 当 发 送 方 不 
需要 或 者 没有 准备 好 传递 秘密 信息 时 ,此 时 不 需要 封装 帧 ,在 信息 发 送 前 对 其 进行 预 处 
理 ,每 当 出 现 连续 5 个 1 后 ,就 将 其 下 一 位 赋 为 0, 这 样 就 有 效 避 免 了 偶然 的 标志 字段 的 
出 现 。 

(2) 编号 字段 : 也 是 帧 首部 的 一 部 分 , 它 是 在 一 次 通信 中 不 同 帧 的 唯一 标识 。 编 号 
字段 一 共有 8b, 可 以 标识 256 个 帧 ,这 也 是 发 送 秘密 信息 的 上 限 。 妆 数据 在 传输 中 出 现 
差错 时 ,编号 字段 的 作用 更 加 明显 。 当 某 一 帧 发 送 失 败 或 者 错误 时 ,发 送 方 不 需要 重新 发 
送 所 有 信息 ,而 是 根据 接收 方 反馈 的 帧 编号 选择 性 地 重新 发 送 。 

(3) 数据 字段 : 即 真 正 需要 传送 的 信息 。 这 里 先 对 秘密 信息 进行 加 密 , 然 后 将 加 密 

后 的 秘密 信息 租 人 到 载体 文本 中 ,最终 得 到 的 含 密 载体 构成 数据 字段 。 

(4) 校 验 字段 : 在 现实 的 通信 过 程 中 都 不 会 是 理想 的 。 也 就 是 说 ,比特 流 在 传输 过 
程 中 可 能 会 产生 差错 :“1” 可 能 会 变 成 “0”; 而 “0” 也 可 能 变 成 “1”。 本 方案 采取 循环 见 余 
检验 (Cyclic Redundancy Check,CRC) 检 错 技 术 ,在 每 帧 尾部 增加 16b 校 验 字段 。 本 方案 
没有 增加 纠 错 比特 ,大 发 生 检 验 错误 , 则 采取 重 发 机 制 处 理 。 

(5) 末尾 帧 格式 : 本 方案 中 ,每 帧 的 长 度 为 160b ,也 就 是 说 , 当 发 现 每 帧 的 标志 字段 
时 , 接 下 来 的 160b 为 一 帧 ,但 是 最 后 一 帧 的 数据 字段 长 度 有 可 能 为 1 一 128 ,为 了 封装 最 
后 一 帧 ,可 以 为 它 设 定 一 个 特殊 的 帧 格式 ,如 图 10-5 所 示 。 


顺 首 部 一 | 一 一 数据 字段 i 


ecb et a 


图 10-5 ”末尾 帧 格式 


在 末尾 帧 中 ,编号 字段 恒 设 为 10101010 ,在 数据 字段 中 加 入 数据 长 度 , 该 字段 记录 了 
数据 的 长 度 (length) , 共 8b, 根 据 数据 长 度 字 段 确定 末尾 帧 的 长 度 。 
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10.2.2 ”差错 检测 


在 信息 传输 过 程 中 不 可 避免 地 会 产生 差错 ,我们 在 传输 过 程 中 把 数据 划分 为 帧 ,每 一 
帧 都 加 上 元 余人 码 , 一 帧 接 一 帧 地 传送 ,然后 在 接收 方 逐 帧 进行 差错 检验 。 凡 是 接收 并 能 接 
收 到 的 帧 ,我 们 都 能 以 非常 接近 1 的 概率 认为 这 些 帧 在 传输 过 程 中 没有 产生 差错 。 

前 面 已 经 提 到 ,本 方案 中 采用 CRC 差错 检测 技术 , 它 可 以 有 效 做 到 对 帧 的 无 差错 接 
收 。 厂 接收 端 因为 有 差错 而 没有 接收 到 某 些 帆 , 可 以 根据 巾 的 编号 字段 的 编号 确定 哪些 
WER ,然后 将 丢失 的 帧 重新 发 送 , 这 样 就 可 以 达到 “可 徘 传 输 ”, 即 发 送 疾 发 送 什 么 ,在 接 
收 绒 就 能 收 到 什么 ,如 图 10-6 所 示 。 


接收 数据 


EAE 


图 10-6 CRC 差错 检测 原理 


CRC 差错 检测 原理 如 图 10-6 所 示 。 在 发 送 端 , 对 于 & 比特 的 数据 块 M ,CRC 运算 就 
是 在 数据 块 M 的 后 面 添 加 供 差 错 检测 用 的 位 元 余人 码 , 一 起 发 送出 去 ,一 共 发 送 (k 十 n) 
位 。 这 种 为 了 进行 检 错 而 添加 的 元 余人 码 称 为 帧 检测 序列 (Frame Check Sequence,FCS)。 
这 个 比特 序列 要 使 最 后 得 到 的 CR 十 2) 比特 的 帧 可 以 被 一 些 预 先 设 定 的 数值 整除 ,然后 ， 
接收 副 利 用 同样 的 数值 对 接收 到 的 帧 进行 除法 运算 ,如 果 其 结果 没有 余数 , 则 判定 这 个 帧 
没有 差错 。 本 方案 利用 CRC 差错 检测 技术 将 秘密 信息 和 差错 控制 码 进行 绑 定 ,作为 藤 人 
信息 共同 添加 到 文本 中 ,以 达到 在 接收 端 可 以 检测 偶发 差错 的 目的 。 

在 所 要 发 送 的 数据 后 面 增加 半 位 元 余人 码 ,虽然 增加 了 数据 传输 的 开销 ,但 却 可 以 进行 
差错 检测 。 当 传输 可 能 出 现 差错 时 ,付出 这 种 代价 往往 是 值得 的 。 


10.2.3 发 送 模块 


发 送 模块 主要 是 将 秘密 信息 艇 入 到 用 户 正 党 的 聊天 语句 中 ,然后 通过 隐 信 道 发 送 给 
接收 方 。 这 部 分 主要 包括 以 下 两 方面 工作 ,在 此 首先 进行 如 下 定义 。 
C: 载体 文本 ;M: 秘密 信息 ; K: As n: 成 帧 个 数 ; S: 含 密 载体 文本 。 
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1. 秘密 信息 

利用 隐 信 道 发 送 秘密 信息 时 ,首先 对 秘密 信息 进行 编码 ,然后 利用 密 钥 对 其 进行 加 
密 , 最 后 对 加 密 后 的 比特 串 封装 成 帧 ,此 时 需要 注意 封装 后 的 最 后 一 帧 的 格式 与 其 他 帧 
不 同 。 

算法 10.1 帧 封装 算法 。 

D 将 加 密 后 的 秘密 信息 M 以 128b 进行 分 组 , 即 M =mm m, i l N M' 的 二 
进 制 编码 长 度 , 则 n=[ 1/128 l 

BW. An > 256, EM s on < 256, 则 首先 将 om. 至 m,_1 作 为 数据 段 按 照 
帧 格式 依次 成 帧 , 帧 编号 依次 为 0~n 一 2, 然 后 将 m， 作为 数据 段 按 照 未 尾 帧 格式 成 由 , 帧 
编号 为 256( 即 编号 字段 为 10101010) 。 

2. AERA 

信息 舱 入 主要 是 将 封装 成 帆 的 秘密 信息 舱 入 到 正常 的 聊天 语句 中 ,然后 发 送 给 接收 
方 , 如 图 10-7 所 示 。 


在 DD 中 扫描 匹配 的 同义词 


Z ë a S 
Pm o TT 25D 
图 10-7 ”信息 敌人 示意 图 


将 用 户 的 正常 聊天 语句 ( 即 载体 文本 C ) 以 每 次 发 送 的 内 容 为 单位 进行 处 理 , 判 断 其 
是 否 符合 蔡 换 条 件 , 知 符 合 , 则 根据 条 件 转移 概率 Psic ,利用 密 钥 K 将 已 经 封装 成 帧 的 
秘密 信息 通过 多 载体 模型 中 的 中 文 同 义 词 苦 换 算法 通 人 其 中 ,并 通过 隐 信 道 发 送 给 接收 
方 ; 吉 不 符合 就 直接 通过 公开 信道 进行 发 送 。 有 具体 流程 如 图 10-8 所 示 。 

算法 10.2 发 送 端 蒋 人 算法 。 

获取 伪 客 户 端 聊天 载体 C 一 cicz…cw。 

@ 等 待 请 求 操 作 AIA mA TOR WO .AA RA BR WHO. 

输入 混合 密 钥 KK。 


隐 黎 的 原理 及 应 用 


秘密 信息 输入 


编码 加 窑 


打包 成 帧 


图 10-8 AX im it FE A 


由 输入 秘密 信息 ,并 取 其 Unicode 编码 得 到 二 进 制 码 串 M., 

根据 密 钥 K.S K’= K ,采用 3DES 算法 对 秘密 信息 M 进行 加 密 , 此 时 MM’'= 
E(K,D(K',E(K,M))). 

对 M 进行 位 填充 ,并 封装 成 一 组 帧 序列 , 共 封 装 成 n 个 帧 。 

D 对 聊天 载体 c: GE [1.0 ,< 委 z) 进 行 预 处 理 , 若 出 现 5 个 连续 “1”, 则 将 其 下 一 位 
赋 为 "0” ,否则 不 做 处 理 。 

载体 分 析 。 若 能 通过 候选 词 模型 , 则 转 @ ,否则 转 @。 

© 从 混合 密 钥 K 中 提取 二 次 剩余 密 钥 天, ,同时 根据 K 和 帧 的 个 数 计算 条 件 转移 
概率 P, ,利用 多 载体 模型 中 的 中 文 同义词 替换 算法 能 人 秘密 信息 。 

W 通过 Socket 发 送 消息 。 

D 循环 执行 四 一 加 ,直到 @@ 中 封装 的 所 有 帧 均 能 人 并 发 送 完 毕 。 


10.2.4 接收 模块 


与 发 送 模块 类 似 ,接收 模块 同样 包含 两 方面 内 容 。 首 先是 将 封装 成 帧 的 秘密 信息 从 
经 过 替换 的 聊天 语句 中 解析 出 来 ,然后 从 解析 出 来 的 一 组 帧 中 提取 出 秘密 信息 。 在 接收 
模块 中 需要 用 户 输入 与 发 送 端 相同 的 密 钥 ,同样 也 需要 与 发 送 方 相同 的 同义词 库 的 支持 。 
1. 信息 提取 
根据 接收 到 的 聊天 语句 ( 即 含 密 载体 文本 S) 和 条 件 转移 概率 Psc ,利用 密 钥 OK 将 已 
经 封装 成 帧 的 秘密 信息 提取 出 来 。 具 体 流 程 如 图 10-9 所 示 。 
144 


第 10 章 文本 替换 的 隐藏 系统 


接收 聊天 信息 


SES Saey 


分 词 解析 


同义词 比 对 解密 编码 


Y 


Y 
提取 帧 信息 


达到 一 帧 长 度 ? 一 CRC 校 验 


m ua 


是 否 为 最 后 一 帧 ? 


10-9 Pe Wn iit Fe A 


首先 对 用 户 接 收 到 的 聊天 语句 进行 分 词 解 析 , 通 过 同义词 比 对 找 出 封装 成 帆 的 信息 
的 帧 头 标 志 位 ,提取 帧 信息 ,通过 CRC 校 验 后 得 到 一 组 帧 序列 ,然后 从 这 组 帧 序列 中 提取 
出 数据 字段 ,再 通过 解密 及 编码 恢复 出 秘密 信息 。 

算法 10.3 接收 端 提取 算法 。 

D 通过 Socket 接收 伪 客 户 端 聊天 语句 eee! eS et T 

输入 混合 密 钥 K. 

@ 从 混合 密 钥 K 中 提取 二 次 剩余 密 钥 K. 

由 根据 K: ,对 比 同 义 词 编码 提取 隐蔽 信道 信息 。 

若 出 现 帧 起 始 标志 , 则 启动 计数 器 , ”三 0, 否 则 转 由 。 

接收 帧 序号 ,判断 是 否 为 最 后 一 帧 , 硅 不 是 , 则 将 计数 费 n 加 1, 转 @，。 

若是 最 后 一 帧 , 则 转 @ ,至 此 共 提 取出 个 帧 序列 。 

D 对 接收 到 的 每 一 帧 进行 CRC 校 验 。 

提取 出 所 有 帧 的 数据 段 ,根据 密 钥 K 和 由 的 个 数 ” 计 算 条 件 转移 概率 P, ,利用 多 
载体 模型 中 的 中 文 同 义 词 提 取 算 法 提取 二 进 制 串 M 。 

© 根据 密 钥 K.S K 王 开 ,对 二 进 制 串 M 采用 3DES 解密 ,得 到 秘密 信息 M, 
M=D(K,E(K’,D(K.M’))) ,然后 将 M 按照 Unicode 编码 得 到 秘密 信息 。 

2. 帧 解析 

帧 解析 是 指 根据 各 个 封装 帆 中 的 数据 位 组 成 的 比特 串 ,去 掉 其 额外 加 入 的 比特 位 ,得 
到 实际 的 数据 信息 。 解 析 时 同样 需要 注意 最 后 一 帧 的 帧 格式 与 其 他 帧 格式 的 不 同 。 

算法 10.4 帧 解析 算法 。 
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O 从 隐 信 道中 提取 秘密 信息 的 比特 串 。 

© AR FLAG 标志 (01101010) 后 , 奉 它 不 是 最 后 一 帧 (FLAG 后 的 连续 8 位 不 是 二 
进 制 1101010) , 则 连续 接收 160b 数据 (包括 帧 首部 和 帧 尾部 ); 硅 它 是 最 后 一 帧 (FLAG 
后 的 连续 8 位 是 二 进 制 10101010), 则 根据 末尾 帧 格式 连续 接收 (length 十 40)b 数据 ( 包 
括 帧 首部 和 帧 尾部 )。 

© 对 接收 到 的 帧 进行 CRC 校 验 。 

@ TIM n APERA GE E m ,mz ,…，m, 组 成 加 密 后 的 秘密 信息 M 。 


“103 ”系统 实现 


10.3.1 实验 环境 

以 Windows XP 操作 系统 为 工作 平台 ,使 用 Visual C++ 6.0 进行 系统 的 编译 /汇编 ， 
开发 语言 为 C++, 

10.3.2 具体 实现 

在 具体 实现 中 选用 基于 客户 (Client) /服务 紫 (Server) 体 系 结构 的 系统 ,减少 网 络 瓶 
aM ,提高 数据 传输 效率 ,使 用 过 程 安全 快速 。 系 统 中 主要 包括 服务 器 端 和 客户 端 两 部 分 。 

1. AK 35 3 im 

进入 服务 器 端 系 统 时 , 需 设 置 通信 端口 号 ,默认 为 8888 ,并 单 击 “启动 ?按钮 ,运行 服 
务 需 端 系统 ,如 图 10-10 Pras. IRB AIBA. Pw WIE LET. 


图 10-10 HRZ átm 


ee 第 10 齐 文本 替换 的 隐藏 系统 OV 


2. 客户 端 

本 书 之 前 提出 的 基于 同义词 奉 换 的 信息 隐藏 算法 和 隐蔽 通信 方案 将 在 这 部 分 实现 。 
首先 需 有 有 用户 登录 客户 端 , 如 图 10-11 所 示 。 登 录 后 会 显示 当前 在 线 用 户 列 表 , 如 
图 10-12 所 示 。 


图 10-11 客户 端 登 录 图 10-12 在 线 用 户 列表 


通信 双方 通信 时 ,首先 需 选 择 是 “普通 消息 ”, 还 是 “隐藏 消 肯 ”, 如 图 10-13 所 示 。 普 通 


图 10-13 对话 窗口 
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聊天 就 是 正常 的 网 络 通信 ,此 时 没有 秘密 信息 发 送 ,因此 不 需要 戏 入 秘密 信息 ;隐藏 消息 
是 指 当 有 秘密 信息 发 送 时 ,需要 赎 人 秘密 信息 的 消息 ,此 时 需要 输入 密 钥 和 秘密 信息 ,如 
10-14 所 示 。 单 击 “ 初 始 化 ?按钮 ,系统 将 秘密 信息 封装 成 帧 ,用 户 输入 聊天 信息 后 , 单 
击 * 开 始 嵌 入 帧 按钮 ,系统 将 把 秘密 信息 嵌入 到 聊天 载体 中 ,这 样 就 将 秘密 信息 通过 聊天 
载体 发 送 给 接收 方 ,同时 , 帧 嵌入 进度 条 显示 了 秘密 信息 当前 艇 和 人 的 容量 。 


TARAH iT COS. BITS LEM, PSSST 
FAREL. WHEEL, MERA TSE. MSS. FREE. 淮 备 处 理 : 
(>Re, ESSERE HES, BPS SPH HRS Tees. ARASH TE Tei. LS Tae LRM» MARE = 
I 说 : 尘 洁 秀 的 面孔 。 她 将 围 巾 搭 在 启 上 ， PRR TSE. hte. 
她 环顾 了 转眼 四 周围 ， 娃 子 玩 得 正 欢 ， 地 正在 身后 鼓 换 她 芭 完 提 手 的 苹果 。 注 视 节 挑 了 THRAAhEL - SESE MES» Se SSA ， 依 热能 
小 半 和 祖 太 祖 红 的 苹果 . RTS. AST. WE Re Susie Rees ye 显示 出 她 那 扁平 的 细 腰 。 
队 。 


丁 实 电子 科技 太 字 


SOE rae a 


eer: 1 ie AEE: 


ES SSS 


接收 到 的 信息 : 


RREH: 
(anei) 

ERRES: 0 | BSED: | 
秘密 信息 : 


图 10-14 mA/HR BO 


接收 方 接收 到 对 方 发 来 的 信息 时 ,输入 提取 密 铀 ,这 里 的 提取 密 钥 和 嵌入 密 钥 是 相同 
的 ,然后 单 击 “初始 化 按钮 ,就 可 以 提取 消息 了 ,此 时 系统 会 提取 出 聊天 载体 中 工人 的 由 
信息 ,根据 帧 提取 进度 条 的 提示 , 当 帧 提取 完毕 时 ,就 可 以 通过 单 击 “解密 ”按钮 得 到 秘密 
信息 。 
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第 11 音 
| JEP H264 视频 压缩 


Das TEN Bok 345 INA 


Hi AI yA A 8 32 AR. A Bi a a fi ET FE AS. 7b FA A dt OK A e 
大 量 的 数据 隐 密 通信 提供 了 可 能 。 本 章 基 于 H. 264 视频 压缩 编码 标准 ,讨论 了 结合 压 
缩 `. 量 化 以 及 隐 密 的 融合 性 视频 隐 密 通信 技术 。 


111 了 .2604 庄 缩编 码 向 介 


H. 264 视频 编码 标准 采用 “回归 基本 ”的 人 简洁 设计 ,获得 比 H. 263 好 得 多 的 压缩 性 
能 ;加 强 了 对 各 种 信道 的 适应 能 力 ,采用 “网络 友 好 ”的 结构 和 语法 ,有 利于 对 误 码 和 丢 包 
的 处 理 ; 应 用 目标 范围 较 宽 ,以 满足 不 同 速率 .不 同 解析 度 以 及 不 同 传输 (存储 ) 场 合 的 需 
求 , 如 统一 的 VLC 符号 编码 ,高 精度 、 多 模式 的 位 移 估计, 基于 4X4 块 的 整数 变换 ,分 层 
的 编码 语法 等 。 这 些 措 施 使 得 是. 264 算法 具有 很 高 的 编码 效率 ,在 相同 的 重建 图 像 质量 
下 ,能够 比 H. 263 节约 SONA A AIS. H. 264 的 码 流 结构 网 络 适 应 性 强 ,增加 了 差错 
恢复 能 力 ,能 够 很 好 地 适应 IP 和 无 线 网 络 的 应 用 。 


Om MARWAR 


帧 内 预测 一 ”编码 流程 如 图 11-1 所 示 , 是 指 利 用 当前 帧 中 已 重建 宏 块 的 编码 信息 
对 当前 宏 块 进行 预测 的 一 种 编码 方式 。 利 用 当前 编码 块 的 相 邻 像素 直接 对 当前 块 的 每 个 
像素 值 做 预测 ,以 消除 空间 宛 余 。 在 H. 264 帧 内 预测 中 , 色 度 信息 和 亮度 信息 是 分 开 预 
测 的 ,并 且 各 上 自 具 有 多 种 预测 模式 。 预 测 时 需要 采用 特定 的 代价 计算 方法 选择 最 佳 预测 
模式 , 求 得 当前 块 的 估计 值 。 

在 H. 264 中 , 帧 内 亮度 预测 9 分 为 帧 内 4X4 亮度 预测 和 帧 内 16X16 亮度 预测 两 
MRS. ARAMA 8X8 色 度 预测 。 其 中 帧 内 4X4 亮度 预测 有 9 种 预测 模式 ,主要 用 在 
细节 较 多 的 区 域 ,而 帧 内 16X16 亮度 预测 有 4 种 预测 模式 ,主要 用 在 图 像 中 比较 平坦 的 
地 方 。 帧 内 8X8 色 度 预测 和 帧 内 16X16 亮度 预测 较 相 似 , 有 4 种 预测 模式 。 


1121 WA 4X43 Em 
Wip 4X4 亮度 预测 是 以 一 个 4X4 数 据 块 为 基本 预测 单元 ,利用 左边 和 上 边 相 邻 块 


am 隐 密 的 原理 及 应 A Qs 


16x16 宏 块 


帧 内 预测 块 
帧 内 预测 模式 


图 11-1 帧 内 预测 编码 流程 
已 编码 重 构 的 像素 为 参考 像素 进行 预测 。 如 图 11-2 所 示 ,4A 一 M 是 一 个 4X4 块 数据 的 


参考 像素 ,0 一 15 是 4X4 块 的 原始 像素 。 在 H. 264 中 , 帧 内 4 义 4 亮 度 预测 一 共有 9 种 预 
测 模式 。 


M A B C | D E F GH 
| a b C d 
] = f g h 
K | | K | 
L m n O p 
0 (vertical) 1 (horizontal) 3 (diagonal down-left) 4 (diagonal down-tight) 
ao TAT FH 7 ee 
Th 


5 (vertical-right) 6 (horizontal-down) 


11-2 4X4 亮 度 预测 的 9 种 预测 模式 


(1) 模式 0( 垂 下 模式 ): 当前 宏 块 每 列 像素 的 预测 值 就 是 上 边 的 参考 像素 。 
当 A,B,C,D 4 个 样本 点 都 可 用 时 ,预测 过 程 为 
一 a,e,i,m 由 A 预测 
一 b,f,j,n 由 B 预测 
一 c,g;k,o 由 C 预测 
—d,h,l,p 由 DD 预测 
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(2) 模式 1( 水 平 模式 ): 当前 宏 块 每 行 像素 的 预测 值 就 是 左边 的 参考 像素 。 
当 I、J、K.、L 都 可 用 时 ,预测 过 程 为 
一 ayb,c,d 由 工 预测 
一 ef,g,h 由 J 预测 
一 1,j;k,l 由 KK 预测 
一 m,n,;0;p E L mil 
(3) 模式 2(DC HH): 当前 宏 块 所 有 像素 的 预测 值 就 是 上 边 和 左边 参考 像素 的 平 
均值 。 

如 果 A、B、C.D、I、J、.K.、L 都 可 用 , 则 所 有 像素 值 为 

(A+B+C+D+I+J+K+L+4)/8 
如 果 A、B、C.D 不 可 用 ,而 I.J、K、L 可 用 , 则 所 有 像素 值 为 

(I+J+K+L+2)/4; 
反之 为 (A 十 B 十 C 十 D 二 2)/4 
如 果 A、B、C、D、I、J、K.L 均 不 可 用 , 则 所 有 像素 值 为 128. 
(4) 模式 3( 下 左 对 角 线 ): 由 对 应 参考 像素 值 加 权 得 出 相应 像素 的 预测 值 。 
当 A、B、C、D 都 可 用 时 ,预测 过 程 为 
一 a 预测 为 (A 十 2B 十 C 十 2)/4; 
一 b、e 预测 为 (B 十 2C 十 D 十 2)/4; 
—c f i 预测 为 (C+2D+E+2)/4; 
—d.g.j.m 预测 为 (D 十 2E 十 F 十 2)/4; 
一 h、k、n 预测 为 (E 十 2F 十 G 十 2)/4; 
—] o 预测 为 (F 十 2G 十 H 十 2)/4; 
一 p 预测 为 (G+3H+2)/4; 
(5) 模式 4( 下 右 对 角 线 ) : 由 对 应 参考 像素 值 加 权 得 出 相应 像素 的 预测 值 。 
当 A.BC、DJIJK、L 和 M 都 可 用 时 ,预测 过 程 为 
一 m 预测 为 J 十 2K 十 L 十 2)/4; 
一 i,n 预测 为 (I 十 2J 十 KK 十 2)/4; 
—e,j,o 预测 为 (M 十 2I 十 J 十 2)/4; 
一 a,f,k,p 预测 为 (A 十 2M 十 I 十 2)/4; 
一 b,g,] 预测 为 (M 十 2A 十 B 十 2)/4; 
一 c,h 预测 为 (A 十 2B 十 C 十 2)/4; 
一 d 预测 为 (B 十 2C 十 DD 十 2)/4。 
(6) 模式 SERA): 由 对 应 参考 像素 值 加 权 得 出 相应 像素 的 预测 值 。 
当 A、BC、DIJK、 和 M 都 可 用 时 ,预测 过 程 为 
一 a,j 预测 为 (M 十 A 十 1)/2; 
一 b,k 预测 为 (A 十 B 十 1)/2; 
一 c,] 预测 为 (B 十 C 十 1)/2; 
一 d 预测 为 (C 十 D 十 1)/2; 
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一 en 预测 为 (I 十 2M 十 A 二 2)/4; 

—f,o 预测 为 (M 十 2A 十 B 二 2)/4; 

—g,p 预测 为 (A 十 2B 十 C 十 2)/4; 

一 h 预测 为 (B 十 2C 十 D 十 2)/4; 

一 1 预测 为 (Q 十 2I 十 J 十 2)/4; 

一 m 预测 为 (I 十 2J 十 KK 十 2)/4。 

(7) 模式 GOKE F): 由 对 应 参考 像素 值 加 权 得 出 相应 像素 的 预测 值 。 

当 A、BC、D、IJK、 和 M 都 可 用 时 ,预测 过 程 为 

一 a,g 预测 为 (M 十 AI 十 1)72; 

一 b,h 预测 为 (I 十 2M 十 A 十 2)/4; 

一 c 预测 为 (M 十 2A 十 B 十 2)/4; 

一 d 预测 为 (A 十 2B 十 C 十 2)/4; 

—e,k 预测 为 (I 十 J 十 1)/2; 

一 了 ,1 预测 为 (M 十 2I 十 J 十 2)/4; 

—i,o 预测 为 J 十 KK 十 1)/2; 

一 j,p 预测 为 (I 十 2J 十 K 二 2)/4; 

一 m 预测 为 (K 十 LL 十 1)/2; 

一 n 预测 为 J 十 2K 十 LL 十 2)/4。 

(8) 模式 7 (46 EmA): 由 对 应 参考 像素 值 加 权 得 出 相应 像素 的 预测 值 。 

当 A、B、C.D 都 可 用 时 ,预测 过 程 为 

一 a 预测 为 (A 十 B 十 1)/2; 

一 b,i 预测 为 (B 十 C 十 1)/2; 

—c,j 预测 为 (C 十 D 十 1)/2; 

一 d,k 预测 为 (D 十 E 十 1)/2; 

一 ] 预测 为 (E 十 F 十 1)/2; 

一 e 预测 为 (A 十 2B 十 C 十 2)/4; 

一 f,m 预测 为 (B 十 2C 十 D 十 2)74; 

—g, n 预测 为 (C 十 2D 十 E 十 2)/4; 

—h,o 预测 为 (D 十 2E 十 F 十 2)/4; 

一 p 预测 为 (E 十 2F 十 G 十 2)/4。 

(9) 模式 SOKE HE): 由 对 应 参考 像素 值 加 权 得 出 相应 像素 的 预测 值 。 

当 I、J、K.、L 都 可 用 时 ,预测 过 程 为 

一 a 预测 为 (I 十 J 十 1)/2; 

一 b 预测 为 (I 十 2J 十 KK 十 2)/4; 

一 cye 预测 为 (J 十 KK 十 1)/2; 

—d,f 预测 为 J 十 2K 十 LL 十 2)/4; 

—g,i 预测 为 (K 十 LL 十 1)/2; 

—h,j 预测 为 (K 十 2L 十 M 十 2)/4; 
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—l,n,k,m,0,p 预测 为 Ls 
11.2.2 WA 16X 16 亮度 预测 


当 图 像 中 细节 信息 较 少 时 ,就 采用 帧 内 16X16 亮度 预测 模式 。 帧 内 16 X16 有 4 种 
预测 模式 ,分 别 为 垂直 模式 、 水平 模式 .DC 模式 .平面 模式 ,如 图 11-3 所 示 。 


0 (垂直 模式 ) L (水 平 模式 ) 2 (DC 模式 ) 3 (平面 模式 ) 
图 11-3 WA 16X16 预测 模式 


为 了 便于 分 析 ,给 图 11-3 中 的 参考 像素 和 预测 像素 编 上 坐标 。 令 V 组 元 素 从 上 到 下 
的 坐标 依次 为 (一 1, y), y = 0,1,2,…,15,H 组 元 素 从 左 到 右 的 坐标 依次 为 (zx, 一 1)， 
Zz 一 0,1,2,…，,15 。 当 前 块 左上 角 元 素 坐 标 为 (0,0), 往 右 为 横 坐 标 正方 向 , 往 下 为 纵 坐 
标 正 方向 ; 令 p(x，y) 为 坐标 (x ,yy) 点 的 像素 值 ，pred(x，,y) 为 块 内 坐标 (xz, yy) 点 的 预测 
值 。 下 面 以 这 个 坐标 系 为 基础 ,对 4 种 模式 进行 分 析 。 
C1) 模式 0: 垂直 预测 。 
该 预测 模式 通过 当前 预测 块 正 上 方 的 WH 组 元 素 进 行 预测 ,只 有 当 H 组 元 素 进 行 预 
WW. 组 元 素 都 在 图 像 内 部 时 ,此 种 预测 模式 才 有 效 。 块 内 各 像素 点 的 计算 值 如 下 。 
下 25 (11-1) 
(2) 模式 1: 水 平 预测 。 
该 预测 模式 通过 当前 块 正 左 侧 的 V 组 元 素 进 行 预测 ,只 有 当 V Ac RAE BRA ob 
时 ,此 种 预测 模式 才 有 效 。 块 内 各 像素 点 的 计算 值 如 下 。 
1 (11-2) 
(3) 模式 2: DC 预测 。 
该 预测 模式 根据 当前 块 H 组 元 素 和 V 组 元 素 的 有 无 ,计算 公式 有 所 不 同 。 当 只 有 
V 组 元 素 时 ,计算 公式 为 
pred (x,y) = (>) p(—- 1, y) +8)/16. xs y = 0,1,2,°*-,15 (lies 


“AA HH 元 素 时 ,计算 公式 为 


pred (x,y) = (> p(x,—1) +8)/16. x£, y = 051,250,515 (11-4) 


x=0 
4% H AA V 组 元 素 都 存在 时 ,计算 公式 为 


(11-5) 
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4H AAV 组 元 素 都 不 存在 时 , 令 当 前 块 所 有 元 素 的 预测 值 都 为 128 ,计算 公式 为 
pred (x, y) = 128, xs y = 051,2,°°°,15 (11-6) 
(4) 模式 3: 平面 预测 。 
该 预测 模式 通过 当前 预测 块 正 上 方 的 互 组 和 正 左 侧 的 V 组 元 素 共 同 预测 ,因此 只 
适合 于 H 组 元 素 和 V 组 元 素 都 存在 的 情况 。 对 H ALLRA V 组 元 系 ,定义 


7 
H= >) («@+1)(p(8+2,—-1l—p6—zx,—1)) (11-7) 
= 
V= SOtD@CH1,8+ y) — p(—1,6— y)) (11-8) 
= 
a = 16X ( p(— 1,15) + £15, —1)) (11-9) 
b= (5X H+ 32) / 64 (11-10) 
c = (5 XV + 32) / 64 (11-11) 
预测 结果 为 
pred(x, y) 一 ciib((a 十 bz 一 7) 十 c(y 一 7) +16) / 32) ee 
xs y = 0,1,2,---,15 
其 中 , clipO APR HR RZ EMA 
0 r0 
clip (x) = is x > 255 (11-13) 
x ”其 他 


1123 帧 内 色 度 8X8 预 测 


要 完成 完整 的 视频 显示 , 色 度 分 量 也 是 相当 重要 的 一 个 因素 。 在 采用 4:2:0 的 
YUV 格式 的 视频 源 下 ,H.264 标准 中 将 一 个 16 X16 亮度 块 和 两 个 8x8 的 色 度 块 合 起 
来 称 为 一 个 完整 的 宏 块 。 因 为 相对 来 说 ,人 有 眼 对 亮度 的 敏感 性 大 于 对 色 度 的 敏感 性 ,所 以 
色 度 的 数据 量 较 小 ,也 完成 了 一 个 小 量 的 压缩 。 

一 个 宏 块 中 包含 一 个 8X8 块 的 色 度 U 分 量 和 一 个 8x8 块 的 色 度 V 分 量 ,其 预测 方 
法 和 亮度 16 X16 类 似 , 也 是 4 种 模式 : 垂直 模式 、. 水 平 模式 .DC 预测 .平面 预测 ,计算 方 
法 略 有 不 同 , 如 图 11-4 所 示 。 


| So4xl S1 4x1 


§2 dc0 del 
x4 4x4 4x4 


5. dc? dc3 
xe 4x4 4x4 


(a) DC_LEFT 模 式 (b) DC_TOP 模 式 (c) DC 模式 
图 11-4 帧 内 色 度 8X8 DC 预测 模式 
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(1) 垂直 模式 : 当前 宏 块 每 列 像素 的 预测 值 就 是 对 应 上 边 的 参考 像素 。 

(2) 水 平 模式 : 当前 宏 块 每 行 像素 的 预测 值 就 是 对 应 左边 的 参考 像素 。 

(3) DC 预测 : 根据 宏 块 位 置 的 不 同 ,DC 又 分 为 4 种 形式 。 

(a) DC 128; 左边 和 上 边 都 无 参考 像素 时 ,预测 值 为 128 。 

(b) DC_LEFT: 只 有 左边 参考 像素 时 ,预测 值 如 图 11-4(a) 所 示 , 上 边 4X8 RAB 
的 预测 值 为 其 对 应 左边 4 个 参考 像素 的 平均 值 , 下 边 4X8 块 像素 的 预测 值 为 其 对 应 左边 
4 个 参考 像素 的 平均 值 。 

(c) DC_TOP: 只 有 上 边 参 考 像 系 时 ,预测 值 如 图 11-4(b) 所 示 ,左边 8x4 块 像素 的 
预测 值 为 其 对 应 上 边 4 个 参考 像素 的 平均 值 。 

(d DC 模式 : 当 左 边 和 上 边 都 有 参考 像素 时 ,预测 值 如 图 11-4(c) 所 示 ,dc0 等 于 其 
左边 块 4 个 像素 S2 和 上 边 块 4 个 像素 SO 的 平均 值 ;dcl 等 于 其 上 边 块 4 个 像素 Sl 的 平 
均值 ;dc2 等 于 其 左边 块 4 个 像素 S3 的 平均 值 ;dc3 等 于 其 左边 块 4 个 像素 S3 和 上 边 块 4 
个 像素 Sl 的 平均 值 ,这 是 以 dc 块 的 位 置 为 基准 进行 上 、 下 左右 对 应 。 

(4) 平面 预测 : 该 模式 下 的 预测 值 算法 如 下 。 

pred (x, y) 一 Clip(a 十 5X(Cz 一 3) 十 cX(Cy 一 3) 十 16)/32) (11-14) 

式 (11-14) 中 ,a、b.c 的 值 分 别 为 

a=16X(p[(—1,7]+ pL7,—1)) 
p= (17 X H+ 16)/32 (11-15) 
c= (17 XV +16)/32 
其 中 HV 分 别 为 
H = Dt x (pix [4 + xz, — 1] — piz[2— xz, —1]) 
| 本 (11-16) 
V = Mot X (pix [—1,4+ y]— pixlL—1,2—y]) 


其 中 ClipO 〇 函数 是 指 括号 内 的 数值 如 果 大 于 255 ,结果 就 是 255; 如 果 小 于 0, 结果 就 是 0; 
如 果 为 0~255, 就 是 其 本 身 。 


“113 ”变换 模块 


H. 264 标准 中 用 到 两 种 常见 的 矩阵 运算 , DCT) 和 哈达 玛 变换 5 。 
11.3.1 整数 DCT 


H. 264 标准 采用 整数 DCT 降低 了 以 往 标 准 中 DCT 操作 浮 点 数 的 复杂 性 ,避免 了 浮 

点 数 运 算 引 入 的 舍 人 误差, 只 需 通过 加 法 和 移 位 运算 即 可 实现 整个 变换 过 程 , 从 而 保证 了 

正道 变换 操作 数据 的 一 致 性 。 同 时 ,结合 DCT 与 后 面 的 量化 部 分 ,使 变换 中 的 归 一 化 运 

算 与 量化 中 的 除法 运算 合并 起 来 ,并 利用 乘法 与 移 位 进行 实现 ,从 而 消除 浮 点 数 DCT 正 

变换 与 反 变 换 不 能 完全 匹配 而 产生 的 计算 偏差 。 这样 既 简 化 了 模块 的 复杂 度 ,又 保证 了 

正道 变换 数据 的 一 致 性 ,能 够 得 到 与 标准 DCT 相似 的 编码 效果 。 根 据 标 准 4X4 DCT 的 
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定义 ,其 变换 公式 如 下 
Y = AXA’ (11-17) 
这 里 ,A 是 单位 正 交 和 矩阵 WE AASI. 
1 D 1 本 ] | 1 Di 
z cos(0) z cos (0) z cos (0) z cos (0) 
L /rz 1 (3m) 1 (Se) 1 (Tx 
Fcos( 8 ) zcos( 8 ) > cos ( 8 ) zcos( 8 ) : 
A = (11-18) 
eos(F) Beos(F) Beos( 8) zesh") 
COS E z COS 8 z COS 8 z COS 8 
Fcos(F) cos 人 ) 本 cos( -| 到 cos{( =") 
2 8 2 8 2 8 8 


设 a=t,5= ve int PNE cos ŠT, ih ARFA PR 3 AB PERUA P HE PT4 


a a a a 0 0 0 l l l l 
b c —c —6 0 6 0 0 1 d —d —b | | 
A= — | = BC (11-19) 
a —a —a a 0 0 a 0 1 —1 一 上 l 
c 一 六 b —c 0 0 0 bJtd 一 1 1 —1 
其 中 d=c/b,B HR Ae. PRA BR RIA. HF 
a ab a* ab 
| | | lab b ab b | . 
Y = BCXC'B = (CXC') - E = (CXC' ) | | (11-20) 
a ab a” ab 


ab b? ab b’ 
由 于 a、b\c 都 为 实数 ,在 计算 机 中 需要 考虑 实数 运算 的 复杂 度 和 精确 度 问 题 , 然 而 运 
算 对 象 一 一 像素 值 为 整数 ,为 了 避 倪 实数 运算 的 复杂 性 ,对 DCT 进行 改进 ,将 其 改造 成 
整数 域 中 的 运算 。 
对 于 和 矩阵 五 的 运算 ,可 以 合并 到 后 面 的 量化 中 ,因此 变换 部 分 只 需 考 虑 d( 约 等 于 
0. 4142) 的 影响 。 为 了 进一步 减少 变换 运算 的 复杂 度 ,H. 264 标准 选 定 d 王 1/2。 同 时 ,为 
了 各 免 乘 以 1/2 带 来 的 截断 误差 ,将 1/2 提 到 和 矩阵 外 ,合并 得 到 和 矩阵 玉 , 这 样 得 到 修改 后 
的 公式 为 
Y= (C,XC')+E 
1 1 1 11 rl 2 1 1 a? ab/2 aœ ap/2 
La —2 i «4 =i =2 ab/2 b/4 ab/2 6/4 
1-1 =i 2| | @ ab/2 a ab/2 
1 —2 1-14 |ab/2 87/4 ab/2 B/4 
(11-21) 
A T PR WE TE it AE PRAY — BCE «. FEE 4 需要 满足 正 交 性 , 即 满 足 AAT =I, Atay We 
X a=1/2 RE b= V2/5。 
这 样 就 得 到 了 H. 264 的 整数 DCT 公式 ,其 整个 计算 过 程 都 在 整数 域 中 进行 ,变换 核 
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S 一 CrXCr 只 通过 加 减法 或 左 移 操作 即 可 实现 ,后 面 的 点 乘 运算 也 可 以 方便 地 合并 到 量 
化 过 程 中 。 

同样 ,可 以 推出 IDCT 整数 变换 公式 为 
X= Ci (Y « EDC 


1 1 i i- a ab az ab 1 1 1 1 
_ 1 1⁄2 č =1 -1 || ab 6 ab 6 1 1/2 —1/2 —1 
i ei =l i a ab a? ab t =i =i 1 
1 —1 1 —1/2 ab b ab b Hè -1 1 =p 
CEA 


注意 ,不 同 于 正 向 变换 , 反 向 变换 并 没有 将 1/2 从 变换 矩阵 中 提取 出 来 ,这 样 虽然 会 
产生 截断 误差 ,但 可 以 获得 更 大 的 输出 动态 范围 。 


11.3.2 ”哈达 到 变换 


H. 264 标准 中 对 经 过 DCT 的 DC 系数 再 次 进行 哈达 玛 变 换 。H. 264 标准 中 的 变换 
过 程 如 图 11-5 所 示 。 


4x4 哈 达 玛 变换 4x4 哈 达 玛 反 变 换 
16x16, 8x8 帧 内 DC 系数 
AM. RENE ACH} 
me ees an 4x4 DCTS 


2x2 哈 达 玛 变换 2x2 哈 达 玛 反 变换 


DC 系数 


| nr 
e 


图 11-5 H.264 标准 中 的 变换 过 程 


H. 264 将 亮度 分 量 的 每 个 16 阶 宏 块 分 解 为 16 个 4 阶 二 维 矩 阵 进行 DCT, 然 后 将 变 
换 结 果 中 的 DC 系数 提取 出 来 ,组 成 一 个 4 阶 的 亮度 DC 块 , 再 对 其 进行 Hadamard 变换 。 
同样 ,对 于 色 度 分 量 ,将 其 子 和 矩阵 经 过 DCT 后 的 DC 系数 提取 出 来 ,组 成 一 个 2 阶 的 亮度 
DC 块 ,再 对 其 进行 Hadamard 变换 。 

H. 264 标准 中 4X4 哈达 玛 正 、 道 变换 公式 如 下 。 


l l l l l | | l 

l E e =l l | —i 
Y™ = x /4 (11-23) 

1 —1 =l l Iı =1 =1 l 

L =i L i L <=] L =l 
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1 | 1 1 1 1 1 1 
1 TREE | 1 i 二 二 =1 
x™ 一 r" /4 (11-24) 
| 1 I =i =i 1 
| | TREE | 
2X2 哈达 玛 正 HERA. 
| 1 1] _rl 1 | 
vef ef Ys (11-25) 
i =i 1 —1 
| Í 1] fi 1 | 
wea [> yep 2 11-26) 
l =] | =] 


与 DCT 相 比 ,哈达 玛 变 换 没 有 缩放 因子 Ej 或 E; 的 点 乘 运 算 ,无 须 与 后 面 的 量化 部 


分 合并 。 哈 达 玛 变换 的 系数 均 为 士 1, 只 用 简单 的 加 法 运算 即 可 实现 。 


11.4 量化 模块 


H. 264 标准 - ”中 使 用 的 是 标量 量化 器 ,满足 下 列 条 件 。 
C1) 采用 加 法 减法、 移 位 等 算术 运算 ,避免 除法 等 浮上 点 运算 。 
(2) WA EMERE E, 和 反 回 变换 矩阵 下 ;的 缩放 因子 运算 。 


量化 的 基本 公式 为 : Zy = round(Y,;/Qstep) ,Yi 为 经 过 变换 的 残 差 值 ,Qstep 为 量化 


步 长 。 


H. 264 标准 采用 分 级 量化 提高 码 率 控制 能 力 ,提供 了 52 个 级 别 的 量化 参数 (Quanti- 


zation Parameter,QP), QP 的 取 值 范围 为 0 一 51( 亮 度 QP 的 最 大 值 为 51, 色 度 QP 的 最 
大 值 为 39) ,每 个 QP 值 对 应 一 个 量化 步 长 Qstep, QP 值 每 增加 1, 量 化 步 长 增加 
12.25% ,QP 每 增加 6,Qstep 增加 1 工 倍 。 随 着 QP 值 的 增 大 ,量化 的 精细 度 逐 步 降 低 。 这 
样 ,周期 性 变化 量化 步 长 的 好 处 是 可 以 显著 减少 量化 表 和 反 量 化 表 的 大 小 , 见 表 11-1, 
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R 11-1 H.264 中 量化 步 长 Cstep 与 量化 参数 QP 索引 对 照 表 
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续 表 


和 矩阵 五 /中 的 缩放 因子 a’. ab/2.0°/4 被 整合 到 正 问 量化 右 中 ,直接 对 变换 核 S = 

Cr XCi 量 化 ,量化 后 的 系数 变 为 
| lo PF | | 
Z; = round (S; rd (11-27) 


其 中 ,PF EER EPA) Sa A OW TE RIE RE. PF/Qstep 可 以 用 乘法 因子 MF 
和 右 移 实 现 , 即 令 


25, gbits = 15+ floor(QP / 6) (11-28) 


(0,0),(2,0), (1,1),(1,3), Y} 7 (0,0),(2,0), (1,1),(1,3), 位 置 
(0,2),(2,2) | (3,1),(3,3) (0,2),(2,2) | (3,1),(3,3) 
5825 
5243 


这 样 就 可 以 得 到 H. 264 中 具体 的 量化 过 程 表 达 式 : 
Z; = (S; * MF; +f) >> oits (11-29) 
f AMEE , HEHHEE SN RY FL ST p FY, f= 27" /3 o E] F 
By, f=2°"/6. 
同样 ,可 以 推出 反 量 化 过 程 的 表达 式 为 
乘法 因子 V 的 取 值 见 表 11-3。 
表 11-3 乘法 因子 V 的 取 值 


QP | (0,0),(0,2), | (1,1),(1,3 tit Q Gii 
OGD | Ca ly : (3,1),(3,3) 

0 

1 

2 
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为 了 更 好 地 支持 对 高 清 视 频 的 编码 ,H. 264 标准 引入 了 非 一 致 性 量化 , 即 不 同位 置 
上 的 变换 系数 的 量化 步 长 不 一 样 。 通 过 对 量化 步 长 的 调整 ,可 以 使 编码 的 图 像 更 适合 人 
类 视觉 系统 ,更 真实 。 同 时 也 提供 了 一 种 控制 编码 质量 的 方式 。 

H. 264 使 用 量化 权重 和 矩阵 W 记录 不 同位 置 上 的 权重 系数 。 量 化 权重 越 大 ,量化 步 长 
越 短 ,量化 结果 越 精 细 。 为 了 在 计算 机 中 表示 ,W 中 的 系数 是 权重 的 16 倍 。 标 准 中 预定 
义 了 两 个 积 认 的 量化 权重 系数 矩阵 Flat 4X4_16 和 Flat_8X8_16, 在 编码 占 没 有 使 用 日 
定义 的 量化 权 草 和 矩阵 时 ,解码 句 会 使 用 这 两 个 默认 的 权重 矩阵 。 


[Fe 4X4 16[i][;] = 16, ¿i,j = 0,1,2,3 ee 
"\Flat 8X8 16(i][j] = 16, i,j = 0,1,.…,7 
这 时 , 反 量化 公式 化 为 
(Li - W; = Vi + aa ae 4 — q P 6, P | 24 . 
Y’ 一 | oo ss f se (11-32) 
Ls s W; . V; a QP/6 — 4,QP 2 24 


式 中 ,Y; 是 和 矩阵 了 中 的 转换 系数 ;2 是 输出 的 量化 系数 ;Q step 是 量化 步 长 。H. 264 量化 
过 程 还 要 同时 完成 DCT 中 Ef 乘法 运算 , 它 可 以 表述 为 
Z; = round (W;PF/Qstep) (11-33) 
AP. W; EERW 中 的 转换 系数 ;PF 是 矩阵 EF 中 的 元 素 。 根 据 样 本 点 在 图 像 中 的 位 
置 (i,7) 取 值 , 见 表 11-4。 
表 11-4 PF 的 取 值 


(050) 66240) 4052) 50252) (1,1),€1,3),¢03,1),(3,3) 其 他 情况 


利用 量化 步 长 随 量化 参数 每 增加 6 而 增加 1 倍 的 性 质 , 可 以 进行 一 步 人 简化 计算 , 即 
gbits = 15 + floor (QP/6) 
MF = (PF /Qstep) 2” 
式 中 , floor Wy Bs pki Be CB ANF a A SE AY i KE AD. AW aD RFR (11-34) BW 
Z; = round (W; MF /2** (11-35) 


“115 FH A EIR 


(11-34) 


H. 264 标准 "采用 基于 上 下 文 的 自 适应 编码 算法 对 语法 元 素 进行 编码 。 在 基本 档 
次 采用 上 下 文 自 适应 的 可 变 长 编码 (Context Adaptive Variable Length Coding, 
CACLC); 在 主 档次 采用 上 下 文 自 适应 的 二 进 制 算 术 编 码 (Context Adaptive Binary 
Arithmetic Coding, CABAC). 

CAVLC FF xt 55 BE Al E BE AY he Fe Be i EE AT AA Sib SB HG HS SR Be Pe BE He tt HL, 
和 Zigzag 扫描 后 ,具有 以 下 特性 。 

d) 残 差 块 经 变换 、 量 化 后 ,其 非 零 系数 主要 集中 在 低频 部 分 ,高 频 部 分 的 系数 大 部 
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(2) 低频 位 置 的 非 零 系 数 的 数值 比较 大 , 而 高 频 部 分 上 的 非 零 系 数 的 数值 多 为 十 1 
Al — 1. 

(3) SEA 4 BAY Wa (EE eA — EREM , 非 零 系 数 的 游程 也 有 一 定 的 特性 。 

(4) 相 邻 的 4X4 块 的 非 零 系 数 的 个 数 具 有 一 定 的 关联 性 。 

CAVLC 有 效 利用 相 邻 编码 符号 的 关联 特性 为 当前 编码 符号 选择 合适 的 上 下 文 模 
型 ,降低 了 符号 编码 间 的 信息 元 余 度 。 在 CAVLC 中 ,上 下 文 模型 的 选择 主要 体现 在 : 对 
各 类 非 零 量 化 系数 的 大 小 .位 置 给 以 独立 的 编码 ; 目 适应 更 新 编码 非 零 系 数 所 需 码 表 与 系 
数 后 缀 长 度 。 


“116 ”基于 H.264 的 网 络 视频 隐 密 通信 


随 着 H. 264 视频 压 盎 标准 的 提出 和 推广 ,基于 H. 264 的 信息 隐藏 算法 层出不穷 ,但 
现 有 众多 的 算法 仅 考虑 视频 压缩 编码 得 到 的 运动 天 量 或 只 注重 视频 图 像 的 复杂 度 i A 
略 了 将 二 者 相 结合 的 方法 。 根 据 H. 263/4 等 视频 编 / 解 码 标准 , 帧 间 压 缩 运 动 天 量 越 大 ， 
表示 视频 内 容 变 化 越剧 烈 , 相 关 的 目标 图 像 块 运动 变化 越 大 ,对 这 些 区 域 适 当 改 动 所 引起 
的 失真 易 被 人 眼 忽 视 。 从 信息 隐藏 的 角度 ,运动 矢量 大 相对 于 运动 矢量 小 或 者 无 运动 的 
目标 区 域 适 合 分 布 更 多 的 密 信 。 与 此 同时 , 帧 内 压缩 编码 则 更 期 望 保 留 纹理 复杂 区 域 和 
目标 区 域 ,而 对 于 简单 的 育 景 以 及 平坦 区 域 则 采取 大 的 压缩 。 从 信息 隐藏 的 角度 ,应 该 将 
密 信 隐藏 在 图 像 中 纹理 /边缘 复杂 的 区 域 , 避 免 密 信 出 现在 平坦 区 域 。 因 为 内 容 复杂 也 就 
意味 着 相应 的 区 域 能 够 给 密 信 提供 更 安全 的 掩蔽 空间 ,也 能 增加 密 信 的 租 入 容量 ,在 有 了 噪 
声 干 扰 的 信道 下 传输 ,能够 使 得 密 信 的 误 码 率 降 低 , 从 而 提高 隐 密 传输 的 可 徘 性 。 


11.6.1 视频 内 容 复杂 度 分 析 


为 科 选 出 纹理 复杂 .运动 剧烈 .掩蔽 性 高 的 区 域 , 视 频 内 容 复 杂 度 分 析 包 含 视 频 图 像 
纹理 估计 和 视频 帧 间 运 动 估计 两 个 方面 。 
1) 视频 图 像 纹理 估计 


基于 模糊 炉 " 汪 的 帧 图 像 纹 理 复杂 度 估计 已 经 在 之 前 的 章节 里 做 了 详细 论证 ,这 里 不 再 


攻 述 。 结 合 本 章 以 下 内 容 ,这 里 只 给 出 一 个 mXn 大 小 的 图 像 块 的 平均 模糊 箭 测度 的 定义 。 
Rs = 一 < YVR» (11-36) 


mxXn 
其 中 ,B; 表示 第 i 个 m Xn 大 小 的 腕 度 图 像 块 ， 称 它 为 当前 块 ;Rs 表示 其 纹理 复 猴 应 
RC, y) RIR ERN C, y) Ak K EROR A EE 
2) 视频 帧 间 运 动 估 计 
根据 H. 264 视频 压缩 标准 对 视频 进行 帧 间 运 动 估 计 ”“- ,得 到 一 个 mXn 大 小 的 图 
像 块 的 运动 矢量 为 (Hs ,Vs ) ,通过 欧 氏 距离 求 其 运动 矢量 的 大 小 : 


(11-37) 
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其 中 ,Ss 为 当前 块 运 动乱 量 的 大 小 ;Hs 、Vs 分 别 为 当前 块 相 对 于 预测 块 在 水 平和 垂直 方 
向 上 的 偏 移 量 。 
3) 视频 复杂 度 的 定义 
定义 11.1 结合 视频 帧 图 像 的 纹理 和 运动 估计 , 预 髓 密 视 频 内 容 复杂 度 为 
Fs = Rs, X p+ Ss, X (1—p) (11-38) 
其 中 ,po 为 均衡 系数 (0 二 op 三 1) ,Fs 为 当前 块 的 复杂 度 。 


11.6.2” 隐 密 信 和 道 构建 


1. 隐 密 信道 的 定义 

定义 11.2 待 舱 密 候选 载体 集合 为 {Ci}221 二 {1B1,，B;,…,B,}, BIEI Fa 二 了 万, 其 
中 了 为 视频 参考 帧 ,1 为 集合 中 载体 的 数量 ,TH HERRENE. 

定义 11.3 隐秘 信道 定义 为 : (C) 一 DB ，B Bim) E (Ctm AP M| ARA 
空间 大 小 。 在 密 钥 空间 K 中 , Vki,k; CK ki FARO ALC} Rik 分 别 表示 密 钥 空 
间 中 的 一 个 随机 抽样 。 


2. 载体 能 入 容量 
隐 密 信道 中 各 载体 块 的 嵌入 容量 Ds 为 
n = ceil (Fs X X) (11-39) 
其 中 ,ceil(。) 表 示 向 上 取 整 函数 ,X 为 载体 图 像 块 可 嵌入 的 最 大 密 信 容 量 。 


3. 密 钥 共享 与 变换 

隐 密 变换 过 程 如 算法 11. 1 所 示 。 

算法 11.1 

接收 方 预先 将 目 己 的 临时 口令 k 传输 给 发 送 方 , 发 送 方 将 目 己 的 临时 口令 kB 
kı PET AR ,得 到 密 钥 对 (ma ski) M Cn sk). 

FIET IR H A On ,ki ) 将 密 信 进行 置 乱 Tw SAN D Xp 根据 密 钥 对 (zz » ko) 
置 乱 载体 艇 入 顺序 Doe 5AN Y XIe 

© 按照 8.5.3 节 的 过 程 将 密 信和 骸 入 在 视频 流 中 ,并 将 目 己 的 临时 口令 有 ;通过 其 他 
通道 传输 给 接收 方 。 

由 接收 方 根据 & A ko 采用 同样 的 杂凑 算法 求 出 密 钥 对 (ma ski) P CO ,ks)。 

根据 密 钥 对 (n; ,k; ) 将 载体 提取 顺序 进行 逆 变 换 Pe 5 CAR) ”XTwe ,并 提取 出 
密 信 ;再 根据 (n;,k;) 将 提取 出 的 密 信 进行 逆 变 换 , 得 到 原始 秘密 信息 Du = CAND) 
XTM'。 

其 中 ,Tw 表示 原始 秘密 信息 分 布 ,Tw 为 其 置 乱 后 的 分 布 ;Tc 表 示 原 始 载 体 艇 入 顺序 ， 
Tc 为 其 置 乱 后 的 般 和 人 顺序 ;AN 代表 Arnold 变换 和 矩阵 ,ni ,ki 与 n2 ,ks 为 变换 参数 ;NN 
为 置 乱 空间 。 

密 钥 杂凑 算法 如 算法 11. 2 所 示 。 

算法 11.2 
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将 口令 比特 流 首 尾 对 折 进 行 异 或 操作 ,直到 口令 比特 变 为 32 位 。 

© 将 32 位 的 口令 比特 流 分 为 4 部 分 ,转化 为 十 进 制 ,分 别 得 到 密 钥 对 nn ski AA n ske 
的 值 。 

采用 上 述 密 钥 共享 算法 能 够 有 效 防 止 模 仿 攻击 。 对 于 接收 方 和 发 送 来 说 ,每 次 通信 
均 采 用 临时 口令 进行 杂凑 ,即使 知道 自己 的 临时 口令 ,也 无 法 由 此 推测 出 密 钥 对 的 值 ;而 
对 于 第 三 方 攻击 的 情况 ,如 果 攻 击 者 想 从 含 密 视频 流 中 正确 提取 出 密 信 ,就 必须 同时 知道 
收发 双方 的 临时 口令 ,或 者 知道 密 钥 对 的 各 参数 值 ,要 满足 这 两 种 方式 成 立 的 条 件 均 十 分 


116.3 BaRASHE 


设 一 个 mXn 大 小 的 载体 块 的 亮度 矩阵 表示 为 B;x, ,这 里 我 们 称 其 为 当前 块 , 经 过 帧 
内 预测 估计 后 得 到 的 预测 块 记 为 R,x,。 编 码 时 ,编码 器 将 当前 块 与 预测 块 求 差 , 得 到 的 
残 差 和 矩阵 也 ,可 表示 为 
D = Baw — Ron = ACisj mens ONRi<m0<j<n (11-40) 
在 视频 压缩 过 程 中 ,编码 器 将 对 残 差 矩 阵 进 行 DCT .量化 操作 。 本 章 采 用 LSB 算 
法 ,各 当前 块 属于 隐 密 信道 , 则 将 预 处 理 后 的 密 信 和 通 人 在 其 量化 残 差 块 的 中 频 系 数 中 ,得 
到 含 密 量化 残 差 块 D', ,否则 进行 一 般 的 帧 内 预测 过 程 。 然 后 再 进行 逆 量 化 、 道 DCT 处 
BW Ay BRIE PED. ,该 过 程 可 表示 为 
D en = DCT GQ(D sen) ) s Daxa = LSB (DCT (QODnxn)) ,mi) (11-41) 
其 中 , DCTC + )4% DCT ,zDCT(。) 为 道 DCT,Q(C。) 代 表 量 化 操作 ,ziQ(C。) 为 道 量化 操 
fe, LSBC+ ) 为 LSB HAHM., RHE Di, FRx, SHG BE Bl... 
aa Ras + Dex (11-42) 
FEE BY... HEF — 4 BUR RR Ok Se HE FW PBT EA BLA SE AE 
继续 按照 H. 264 压缩 标准 对 后 续 视 频 序 列 进行 处 理 。 
接收 方 收 到 含 密 视 频 序 列 后 进行 解码 得 到 含 密 量 化 残 差 块 Dx, ,根据 密 钥 nske 在 
相应 的 中 频 系数 中 提取 秘密 信息 ,再 根据 密 钥 n oka 对 密 信 进行 道 Arnold 变换 ,得 到 原 


11.6.4 ”实验 结果 


使 用 8 Bee Ay YUV 标准 视频 序列 (176 X144,150 WD HEA OT. WIKRE KB KB 
率 、 码 长 改变 率 作 为 参考 指标 ,选择 最 新 的 基于 DCT 系数 的 视频 隐 和 密 算 法 HI( 对 比 算法 
1) 和 基于 运动 矢量 的 密 信 嵌入 算法 "(对 比 算法 2) 作 为 对 比 算法 ,如 图 11-6 所 示 。 


1. 算法 和 目 适应 性 能 测试 
图 11-6(a) 为 参考 帧 内 容 分 析 , 两 类 线段 分 别 为 纹理 复杂 度 与 运动 步 长 归 一 化 值 ; 
图 11-6(b) 为 参考 帧 图 像 块 复杂 度 估 计 ，* 表示 候选 载体 集合 ;图 11-6(c) 是 根据 临时 密 
钥 随 机 抽取 的 一 组 隐 密 信道 样本 ,理想 情况 下 为 一 密 一 信道 ;图 11-6(d) 为 隐秘 信道 租 入 
权 值 的 相对 变化 情况 , 权 值 不 同 , 藤 人 量 不 同 。 从 效果 看 ,所 选 载体 块 的 位 置 分 布 在 纹理 
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复杂 上 且 运 动 剧 烈 的 区 域 ,并 且 磐 人权 值 的 变化 与 视频 图 像 内 容 的 变化 一 致 。 


人 TN 
tid | ) | WIL 


lhl 


(c) 隐 密 信道 抽样 样本 (d) 能 入 权 值 相对 变化 情况 
图 11-6 ” 隐 密 信道 构建 过 程 及 其 能 人 权 值 


2. 误 码 率 对 比 测试 
为 了 对 比 基 于 DCT 系数 的 视频 隐 密 算法 、 基 于 运动 矢量 的 密 信 内 人 算法 以 
及 上 自 适 应 视频 内 容 的 信息 隐藏 算法 在 不 同 视 频 序 列 中 的 误 码 率 大 小 ,分 别 选择 FORE- 
MAN 等 8 段 视频 序列 进行 算法 仿真 ,结果 见 表 11-5。 
表 11-5 各 算法 在 不 同 视频 序列 中 的 误 码 率 对 比 ,其 中 黑体 表示 最 优 性 能 
(单位 : bit) 


由 表 11-5 可 知 ,本 章 算 法 将 密 信 租 人 在 图 像 块 DCT 量化 后 的 系数 中 , 密 信 提取 依然 
保持 着 低 的 误 码 率 。 
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3. 失真 率 对 比 结果 
由 于 各 类 算法 的 效果 均 是 人 眼 不 可 感知 的 ,为 精确 量化 失真 程度 ,引入 峰值 信 噪 比 
(Peak Signal to Noise Ratio, PSNR ) 进 行 失 真 率 对 比 , 绪 果 见 表 11-6, 
表 11-6 各 算法 在 不 同 视频 序列 中 的 PSNR 对 比 ,其 中 黑体 表示 最 优 性 能 
(单位 : dB) 

视频 序列 对 比 算法 2 本 章 算法 

CITY 33. 0850 33. 9451 

ETT SS 

TT = = 

ICE 36. 1373 36. 1631 

MOBILE 31. 0613 31.5186 


从 表 11-6 中 可 以 看 出 ,本 章 算 法 将 密 信 和 能 人 在 掩蔽 性 高 的 图 像 块 中 ,PSNR 值 较 优 
于 对 比 算法 。 

4. 人 码 长 改变 率 与 误 码 率 对 比 结果 

为 了 精确 评估 在 相同 压缩 强度 下 (选择 编码 器 默认 固定 量化 步 长 ,quant 一 4) 本 算法 
与 对 比 文献 算法 对 视频 码 长 的 改变 情况 ,引入 码 长 改变 率 

CLR = (OL—EL) / OL (11-43) 

其 中 ,CLR 为 码 长 改变 率 ,OL 为 原始 视频 码 长 , EL 为 含 密 视 频 码 长 ,对 比 结果 见 
表 11-7. 


表 11-7 各 算法 在 不 同 视频 序列 中 的 码 长 改变 率 对 比 , 其 中 黑体 表示 最 优 性 能 
视频 序列 对 比 算法 1 对 比 算 法 2 本 章 算 法 


BUS 8. 2077e-04 0. 0301 2. 4623e-04 
CITY T. 5031e-04 0. 0311 2. 5792-04 


FOOTBALL 2. 5599e-04 0. 0279 1.3733e-04 
HARBOUR 2. 3461e-04 0.0303 5. 4742e-04 
ICE 4,4303e-04 0.0134 1, 7229e-04 


MOBILE 8. 5425e-04 0. 0320 2. 2999e-04 
SOCCER 2. 92306-04 0. 2798 4, 3846e-04 
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AR 11-7 中 可 以 看 出 ,对 比 算法 1 将 密 信 平 铺 和 能 人 在 DCT 系数 中 ,对 原始 视频 改变 
小 , 码 长 变化 较 小 ;对 比 算 法 2 之 所 以 改变 较 大 ,是 因为 其 用 非 最 优 匹配 块 的 差 值 蔡 换 了 
最 优 匹配 块 的 差 值 , 导 致 量化 压缩 后 非 零 系数 增 大 , 码 长 改变 明显 。 本 章 算法 将 密 信 租 人 
在 复杂 度 高 的 区 域 中 ,做 到 了 尽量 避免 修改 堆 值 DCT 量化 系数 ,因而 视频 人 码 长 改变 
较 小 。 
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系统 开发 


手机 用 户 频 繁 使 用 各 类 应 用 软件 ,使 得 大 量 个 人 私密 数据 存留 在 手机 和 网 络 中 。 这 
些 敏感 数据 面临 着 泄露 .窃取 等 多 方面 的 淤 在 威胁 ,特别 是 在 网 络 应 用 育 景 下 更 是 缺乏 对 
敏感 数据 传输 及 存储 的 安全 保护 。 

本 章 讨 论 信 息 隐 藏 技术 在 实时 通信 系统 中 的 应 用 ,介绍 了 基于 Android 系统 的 移动 
终端 实时 隐 密 的 设计 以 及 实现 。 


121 ”网 络 即 时 通信 技术 


12.1.1 即时 通信 技术 


网 络 即时 通信 应 用 将 文字 图像. 音 视 频 .文件 等 多 媒体 通信 业务 集成 于 一 体 , 其 最 基 
本 的 特征 就 是 信息 传递 的 实时 性 和 用 户 交 互 的 便捷 性 。 与 传统 通信 模式 相 比 ,即时 通信 
技术 具有 通信 成 本 低 、 效 率 高 ,实时 性 强 等 优点 。 

即时 通信 软件 涉及 的 网 络 协议 主要 包括 IP、TCP、UDP、RMTP 等 。 根 据 应 用 背景 的 
不 同 , 即 时 通信 技术 可 采用 C/S 通信 模式 .P2P 模式 以 及 基于 C/S 和 P2P 的 混合 模式 。 


12.1.2 即时 通信 系统 中 的 安全 性 诉求 


即时 通信 系统 面临 的 安全 威胁 主要 来 目 以 下 3 个 方面 。 

C1) 用 户主 要 面临 的 威胁 是 针对 客户 端的 攻击 ,主要 包括 信息 盆 听 、 泄 露 : 目前 的 系 
统 中 一 般 只 对 密码 进行 加 密 处 理 , 而 通信 和 内容 几 乎 都 是 明文 传输 ,利用 简单 的 网 络 嗅 探 占 
就 可 以 轻易 还 原 消息 内 容 , 极 易 被 第 三 方 穷 听 , 造 成 信息 泄露 。 信 息 伪 造 : 攻击 者 通过 各 
种 手段 禄 取 合法 用 户 的 账号 信息 ,并 利用 禄 取 的 账户 信息 , 同 其 他 用 户 发 送 垃圾 内 容 或 诈 
骗 信息 。 

(2) 系统 运营 商 面 临 的 安全 威胁 主要 来 目 对 服务 大 的 攻击 ,如 DoS 和 DDoS 攻击 , 攻 
击 者 大 量 模仿 合法 用 户 的 行为 请 求 服务 ,占用 网 络 带宽 和 服务 硕 资 源 , 导 致 合法 用 户 无 法 
获得 服务 。 同 时 , 随 春 移动 文 付 的 方式 越 来 越 普 及 ,服务 仑 中 存储 了 大 量 的 个 人 身份 信息 
和 文 付 信息 ,这 些 信息 一 旦 泄露 ,后 果 不 堪 设想 。 
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(3) 通信 信道 的 中 间 攻 击 。 

目前 ,针对 系统 存在 的 安全 性 问题 也 采取 了 相应 的 安全 措施 ,以 保护 用 户 数 据 安全 。 
主要 的 安全 措施 有 

D 数据 加 密 技 术 : 在 即时 通信 系统 中 ,通常 使 用 两 种 加 密 方 式 保护 数据 安全 : 一 种 
为 存储 加 密 , 是 指 将 一 些 重要 的 本 地 数据 (如 个 人 资料 、 通 信 记 录 等 ) 加 密 保 存 ; 男 一 种 为 
传输 加 密 ,是 指 对 传输 中 的 数据 流 ( 如 账号 .密码 等 ) 进 行 加 密 , 通 过 对 结 点 和 连接 加 密 的 
方式 保护 传输 中 的 数据 使 其 安全 。 

@ 防火 墙 技 术 : 防火 墙 技术 的 核心 是 设置 通过 防火 墙 边 界 的 规则 ,对 于 不 满足 规则 
的 访问 ,防火 墙 都 会 阻止 其 进入 系统 ,防止 造成 进一步 破坏 。 系 统管 理 员 一 般 通 过 明确 禁 
止 某 些 非法 流量 或 者 明确 允许 某 些 合法 流量 保护 系统 安全 。 

注意 : 基于 加 密 技 术 的 保密 措施 ,一 旦 解密 ,用 户 数 据 将 暴露 无 遗 。 防 火 墙 技术 也 并 
不 能 对 基于 正常 通信 的 “ 潜 ” 信 道 攻击 做 到 有 效 防范 。 下 面 重点 介绍 新 的 隐 和 密 技 术 在 网 络 
通信 系统 中 的 应 用 。 


“122 ”网 络 环境 下 的 隐 密 通信 


12.2.1 隐 密 通信 和 模型 
隐 密 通信 模型 如 图 12-1 所 示 。 


EAE A a fa RATEI Hr PERRIN E k ALS 


图 12-1 隐 密 通信 模型 


密 信 通信 模块 以 载体 、. 密 信和 密 钥 作为 输入 , 密 信 可 以 是 多 种 形式 , 笛 见 的 密 信 形式 
有 文字 文档 图像 . 音 视 频 等 。 密 钥 可 以 采用 公 、 私 钥 方 式 , 其 中 私 钥 可 以 通过 其 他 信道 传 
和 输 或 与 含 密 载 体 在 同一 信道 的 不 同时 间 自 传输 , 且 隐 密 通 信 中 的 密 钥 与 原始 载体 无 关 。 
系统 根据 提供 的 多 媒体 载体 类 型 的 不 同 , 艇 密 模 块 使 用 不 同 的 密 信和 构 入 算法 将 处 理 后 的 
密 信和 嵌入 至 多 媒体 载体 中 ,生成 携 密 载体 。 携 密 载体 和 原始 载体 的 基本 特征 一 致 .感官 效 
RAEE ,攻击 者 无 法 分 辨 出 载体 中 是 否 含有 秘密 信息 ,从 而 大 大 降低 密 信 和 被 攻击 和 先 取 的 
可 能 性 ,增强 密 信 在 网 络 信道 中 的 安全 性 。 接 收 到 携 密 载 体 后 , 密 信 提取 模块 中 使 用 与 磐 
入 模块 中 对 应 的 提取 算法 ,结合 分 配 的 密 钥 提取 出 携 密 载体 中 隐藏 的 秘密 信息 。 
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122.2 隐 密 与 一 般 通 信和 系统 的 搭载 模式 

在 网 络 即时 通信 背景 中 ,根据 秘密 信息 隐藏 模块 的 应 用 背景 ,可 以 分 为 以 下 3 种 搭载 
模式 。 

1. 外 挂 式 

外 挂 式 隐 密 通信 模块 的 结构 如 图 12-2 所 示 。 


史 藏 载体 


秘密 信息 


即时 通信 | fen: 即时 通信 
Ze PF ving | i 窗户 端 外 挂 系统 


A 
E: 


外 挂 系统 


含有 秘密 信息 含有 秘密 信息 
的 携 密 载体 的 携 密 载体 


图 12-2 外挂 式 隐 密 通 信 模 块 的 结构 


外 挂 式 隐 密 通信 模块 独立 于 即时 通信 客户 端 。 在 通信 行为 发 生前 ,首先 外 挂 模块 根 
据 提 供 的 隐藏 载体 和 秘密 信息 执行 密 信 和 藤 人 算法 生成 携 密 载 体 , 再 使 用 即时 通信 客户 端 
将 携 密 载体 发 送 至 网 络 中 。 接 收 端 通信 和 客户 端 接收 到 携 密 载体 后 ,将 其 转发 至 外 挂 系 统 ， 
外 挂 系统 执行 密 信 提取 算法 ,还 原 出 秘密 信息 。 

外 挂 式 隐 密 模 块 的 优点 是 结构 简单 ,由 于 外 挂 系统 借助 即时 通信 客户 端 完 成 通信 , 因 
此 不 需要 在 实现 通信 协议 和 结构 上 花费 工作 量 。 但 是 ,其 缺点 也 显而易见 ,这 种 方式 对 于 
非 实 时 通信 数据 易于 实现 信息 隐藏 ,但 在 实时 音 视 频数 据 中 的 隐藏 比较 困难 ,会 影响 通信 
的 实时 性 ,并且 这 种 方式 在 身份 识别 和 认证 时 比较 复杂 。 

2. 注入 式 

注入 式 隐秘 通信 模块 的 结构 如 图 12-3 Ata. 

在 通信 客户 端 发 送 通信 消息 后 ,注入 式 隐 密 模块 通过 Hook 技术 将 通信 中 的 多 媒体 
数据 拦截 ,并 传递 至 隐藏 模块 ,隐藏 模 块 执行 钥 入 算法 将 秘密 信息 舱 入 至 拦截 到 的 数据 中 
生成 携 密 载 体 发 送 至 网 络 。 接 收 方 的 通信 客户 端 在 收 到 消息 前 ,该 通信 消息 首先 被 消息 
Hook 拦截 ,传递 至 隐 密 模块 中 执行 提取 算法 ,还原 出 原始 密 信 。 

注入 式 隐 和 密 模 块 的 优点 和 外 挂 式 隐 和 密 模 块 相同 ,都 依赖 于 第 三 方 通信 和 客户 端 ,无 须 在 
实现 通信 协议 和 通信 结构 上 花费 工作 量 ,实现 相对 简单 。 缺 点 是 需要 在 系统 中 实现 消息 
Hook, ,相对 外 挂 式 较为 复杂 。 
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提取 
提取 模块 
返回 携 窗 消 甩 消息 Hook o iB BA A 
Be IF it 接收 前 


图 12-3 注入 式 隐 密 通信 模块 的 结构 


3. AZPMA 
ye PF vita SX Bik et M A BR ER BY 28 #4) ON A 12-4 所 示 。 


发 送 客户 端 接收 客户 端 
图 12-4 ” 伪 客 户 端 式 隐 密 通信 模块 的 结构 


在 伪 客 户 式 端 隐 密 模型 中 , 隐 密 模块 存在 于 客户 端 内 部 ,与 消息 模块 相互 协调 工作 。 
进行 隐 密 通信 时 , 隐 密 模块 利用 消 有 息 模块 产生 的 多 媒体 数据 作为 载体 ,执行 租 入 算法 将 秘 
密 信息 能 和 人 至 通信 载体 中 ,生成 携 密 载 体 , 经 过 网 络 信道 发 送 至 接收 端 。 接 收 端 客户 端 接 
收 到 携 密 载体 后 使 用 提取 模块 执行 密 信 提取 算法 还 原 秘 密 信 息 。 

由 于 伪 客 户 端 模式 不 信 助 第 三 方 通 信和 客户 凝 ,将 通信 模块 和 隐藏 模块 结合 在 一 起 , 结 
构 更 为 集中 。 而 且 通 信 模 块 和 隐 密 模块 相互 协作 ,客户 端 可 以 实现 多 种 方式 的 隐 密 通信 ， 
功能 更 加 强大 。 但 伪 客 户 问 模 式 的 开发 不 仅 需 要 实现 隐 密 模块 ,还 要 开发 网 络 通信 模块 
和 相关 通信 协议 ,相对 前 两 种 方式 工作 量 较 大 。 


Oa 。 隐 密 系统 设计 


12.3.1 发 送 端 
发 送 方 流 程 如 图 12-5 所 示 。 
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用 户 注 册 并 


I 


输入 消息 内 容 


fan A EA 


选择 隐藏 载体 
marei 
我 体 隐 藏 空间 


是 否 足 够 ? 


输入 通信 和 内容 


ELi 


图 12-5 发 送 方 流程 


12.3.2 ”接收 端 


接收 方 流 程 如 图 12-6 所 示 。 

发 送 方 用 户 在 使 用 隐 和 密 通 信 功 能 时 ,需要 用 户 提 供 秘密 信息 、 输 入 密 钥 、 选 择 合适 的 
载体 。 系 统 执行 佣 人 算法 后 生成 和 正常 多 媒体 消息 相似 的 携 密 载 体 , 发 送 至 接收 端 。 
接收 方 收 到 消息 后 ,如 消息 中 不 携带 秘密 信息 , 则 正常 显示 ,否则 系统 执行 提取 算法 
提取 出 载体 中 的 密 信 ,再 通过 用 户 输入 的 密 钥 还 原 出 原始 秘密 信息 。 


12.3.3 ” 隐 密 通信 系统 染 构 


基于 移动 终端 的 实时 隐 密 系统 采用 C/S(Client/Server) 和 P2P 相 结 合 的 架构 模式 ， 
可 以 将 系统 分 为 客户 端 和 服务 端 。 系 统 架 构图 ,如 图 12-7 Aras. 

服务 絮 属 于 单 例 模 式 , 运 行 在 公共 网 络 上 ,为 所 有 客户 端 提供 服务 。 服 务 器 只 有 
TCP 连接 模块 ,客户 端 与 服务 器 之 间 通 过 TCP 进行 通信 。 客 户 端 在 启动 时 就 请 求 与 服 
FEM TCP 长 连接 ,连接 成 功 后 由 客户 并 定 时 发 送 心 跳 包 ,以 维持 连接 活跃 。 客 户 端 
与 服务 兹 之 间 的 请 求 命令 与 数据 交换 都 通过 这 条 TCP 连接 完成 。 
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12-6 ”接收 方 流程 
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图 12-7 系统 架构 图 
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客户 端 运行 在 Android 智能 手机 上 ,负责 与 用 户 交 互 .与 服务 器 数据 通信 、 完 成 信息 
隐藏 等 功能 。 客 户 端 不 仅 需 要 与 服务 器 进行 数据 通信 ,还 需要 与 其 他 客户 端 建 立 P2P 信 
道 ,因此 客户 端 同时 具有 TCP 模块 和 P2P 模块 。 对 于 大 数据 量 的 通信 ,通信 双方 需要 在 
服务 器 的 协助 下 建立 P2P 信道 ,使 用 P2P 信道 进行 通信 。 这 样 可 以 有 效 降低 服务 器 的 负 
载 ,减少 网 络 拥塞 。 

服务 端的 主要 功能 有 : 

(1) 存储 用 户 的 注册 信息 。 

(2) 在 登录 时 验证 用 户 信息 的 合法 性 。 

(3) 存储 和 更 新 用 户 的 好 友 列 表 。 

(4) 维护 用 户 的 状态 信息 ,如 在 线 状态 、 网 络 地 址 等 。 

(5) 对 用 户 发 送 的 较 短 类 型 的 消息 进行 转发 。 

(6) 协助 客户 端 完 成 NAT 穿越 ,建立 P2P 连接 。 

客户 端的 主要 功能 有 : 

(1) 完成 用 户 注 册 功 能 ,收集 并 向 服务 如 提交 合法 数据 。 

(2) 登录 系统 ,获取 好 友 列 表 及 状态 信息 。 

(3) 管理 好 友 列 表 , 可 添加 或 删除 好 友 。 

(4) 发 送 即时 消息 ,消息 类 型 可 以 是 文本 .图像 .音频 .视频 消息 。 

(5) 秘密 信息 能 和 人 功能。 将 用 户 的 秘密 信息 和 人 至 选 定 的 多 媒体 载体 中 。 

(6) 秘密 信息 提取 功能 。 从 接收 到 的 携 密 载体 中 提取 出 原始 秘密 信息 。 


1234 ” 隐 密 系统 功能 模块 


基于 移动 终端 的 实时 隐 密 通信 系统 分 为 服务 端 和 客户 端 两 部 分 ,其 功能 模块 如 
图 12-8 所 示 。 

服务 端 相 对 于 客户 端 功能 较为 简单 ,主要 包含 三 大 功能 模块 : 用 户 信息 管理 模块 、 消 
息 转 发 模块 以 及 P2P 协助 模块 。 

用 户 信 息 管理 模块 主要 负责 管理 系统 用 户 , 如 存储 用 户 个 人 资料 、 验 证 用 户 号 份 的 
合法 性 、 维 护 系统 用 户 的 通信 关系 .记录 用 户 的 状态 信息 等 功能 ,为 即时 通信 业务 提供 
服务 。 

消息 转发 模块 主要 负责 将 用 户 发 送 的 通信 消息 转发 至 目标 用 户 。 在 C/S 通信 模型 
中 ,由 于 通信 双方 都 不 知道 对 方 的 网 络 地 址 信息 ,因此 需要 服务 器 对 通信 消息 进行 转发 。 
服务 器 收 到 通信 消息 后 ,根据 通信 目标 的 当前 状态 ,条 目标 客户 端 与 服务 器 之 间 存 在 活跃 
的 TCP 连接 , 则 直接 转发 消息 ,否则 会 先 将 通信 消息 缓存 至 消息 数据 库 中 ,等 待 下 一 次 目 
标 用 户 连 接 时 再 进行 转发 。 

P2P 协助 模块 主要 负责 协助 用 户 完 成 NAT 穿越 ,建立 客户 端 之 间 的 P2P 连接 。 一 
般 情 况 下 ,用户 发 送 的 内 容 较 短 的 通信 消息 会 经 过 服务 器 转发 后 到 达 目 标 用 户 ,但 在 用 户 
进行 大 数据 量 .长 时 间 的 通信 时 , 奋 使 用 服务 器 转发 的 方式 ,会 占用 大 量 服 务 器 资源 和 网 
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12-8 系统 功能 模块 图 


络 融 宽 , 因 此 需要 使 用 P2P 的 通信 方式 。 需 要 服务 需 交 换 双 方 网 络 地 址 信息 ,协助 建立 
P2P 连接 。 

客户 并 的 功能 相对 复杂 ,不 仪 需 要 完成 与 服务 冀 和 其 他 终端 的 通信 功能 ,还 需要 处理 
多 媒体 数据 ,并 执行 信息 隐藏 算法 。 客 户 端 主 要 包括 : 用 户 信 息 管 理 模块 .网络 通信 模 
块 、. 信 息 隐 藏 模块 。 

用 户 信息 管理 模块 主要 为 用 户 提供 注册 .登录 功能 ,并 且 人 允许 用 户 管理 个 人 好 友 列 
表 , 可 添加 或 删除 好 友 。 用 户 信息 管 理 模块 的 功能 需要 客户 痢 和 服务 右 协 同 完成 ,因此 服 
务 釉 和 客户 端 都 有 该 模块 ,但 负责 的 内 容 不同 。 

网 络 通信 模块 主要 负责 发 送 和 接收 用 户 的 通信 消息 。 无 论 是 未 通 密 的 正常 通信 和 内 
容 , 还 是 隐藏 后 的 携 密 载体 ,都 需要 经 过 网 络 通 信和 模块 发 送 至 接收 端 。 根 据 发 送 数 据 量 的 
大 小 ,系统 选择 不 同 的 通信 方式 , 较 短 的 通信 消息 会 通过 服务 此 转发 。 大 数据 量 的 通信 和 则 
ZARA at AIK PZP 请 求 ,建立 P2P 连接 。 

信息 隐藏 模 块 是 隐 密 通信 的 核心 模块 ,主要 负责 执行 信息 隐藏 算法 ,包括 密 信 髓 入 功 
能 和 密 信和 提取 功能 。 密 信和 隐藏 是 将 秘密 信息 隐藏 至 多 媒体 载体 中 的 过 程 ,根据 用 户 提供 
的 多 媒体 载体 的 不 同类 型 ,模块 会 执行 不 同 的 隐藏 算法 。 隐 藏 后 产生 的 携 密 载体 经 过 网 
络 通信 模块 发 送 至 接收 器 。 密 信和 提取 是 从 携 密 载体 中 提取 出 秘密 信息 的 过 程 ,根据 接收 
到 携 密 载体 的 类 型 ,执行 相应 的 提取 算法 。 
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1241 用户 信 息 管 理 


用 户 信 息 管 理 模块 主要 负责 存储 管理 用 户 注册 信息 、 登 录 验 证 、 维 护 用 户 的 好 友 列 表 
等 功能 。 此 模块 的 功能 需要 服务 端 和 客户 端 相互 配合 完成 ,客户 端 提 交 请 求 和 用 户 数 据 ， 
服务 硕 负 责 操作 数据 库 并 返回 啊 应 信息 。 该 模块 主要 包含 注册 登录、 管理 用 户 列 表 
功能 。 

1. 注册 功能 

用 户 注 册 时 ,首先 根据 界面 提示 填写 个 人 资料 并 单 击 “提交 ”按钮 。 客 户 端 需要 验证 
信息 的 完整 性 和 合法 性 ,对 于 不 合法 的 数据 ,系统 提示 用 户 重新 填写 。 验 证 通过 后 ,将 数 
据 提 交 至 服务 硕 并 等 待 啊 应 。 

服务 妖 的 业务 层 收 到 客户 问 发 送 的 注册 请 求 后 ,生成 业务 请 求 传递 至 DAO JZ, DAO 
层 为 该 用 户 创 建 一 个 用 户 实 体 并 初始 化 用 户 的 关系 列表 、 消 息 队 列 等 信息 并 存储 至 用 户 
信息 数据 库 中 。 操 作成 功 后 ,服务 紫 癌 客户 端 发 送 注册 成 功 的 啊 应 信息 。 注 册 功 能 时 序 
图 如 图 12-9 所 示 。 


Q 


M B 服务 器 服务 器 


| | 
| | 
1. 用 户 填 写 个 人 资料 | 


| | 
| | 
| | 
2. 验证 信息 | | 
的 有 效 性 及 | | 
完整 性 | | 
| | 
om | | 
3. 2 提示 氏 误 信息 3.1 提交 数据 | | 
e 4. 生成 请 求 。， 
5. 存储 数据 
6. al faz 


7. 返回 业务 结果 | | 


8. 返回 注册 成 功 信息 


| 
as | 
| 
| 

图 12-9 ”注册 功能 时 序 图 
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2. 登录 功能 

系统 使 用 用 户 名 和 密码 组 合 的 方式 进行 登录 。 用 户 输入 用 户 名 和 密码 ,将 加 密 后 的 
数据 提交 至 服务 器 并 等 待 响应 。 

服务 颖 的 业务 层 在 收 到 数据 后 产生 一 个 验证 请 求 ,并 癌 DAO 层 请 求 查询 数据 库 ， 
DAO 层 查找 目标 用 户 的 身份 信息 。 对 比 信息 合法 性 后 向 客户 端 返回 结果 。 客 户 端 收 到 
啊 应 信息 后 ,各 用户 身份 合法 , 则 跳 转 至 系统 的 主 界面 ,否则 显示 错误 信息 。 登 录 功 能 时 
序 图 如 图 12-10 Ara. 


下 
服务 器 服务 器 
| 


| 
| | 
了 1. 用 户 填写 用 户 名 、 密码 | 
进行 MD5 

mE 


| 
| 
| 
| 
2. 对 密码 | 
| 
| 
| 
3. fest aie 


1) 4. Ane BEDE, 
5. 查询 数据 库 


6. 返回 查询 数据 
7. 返回 业务 结果 | 下 TT 
8. 返回 验证 结果 | 下 


9.1 Fa 证 失败 
显示 错误 原因 
9.2 验证 成 功 

显示 主 界 面 


图 12-10 登录 功能 时 序 图 


3. BIA AWRY RE 

FP ae oo a A FP 4 7 AS AG fe A m. 51. A as A. H P FAP A 
并 单 击 “ 添 加 ?按钮 A IP Sia e AR SS ie AZ IE — FR YAS TF A TOR © 

AA at WC BU AC TRY. [ADE PE SEC ATK ,查看 目标 用 户 是 否 存 在 。 寿 目标 用 
户 不 存在 , 则 向 用 户 返回 错误 信息 。 奋 目标 用 户 存在 , 则 办 目标 用 户 发 送 一 条 好 友 申 请 信 
奶 。 目 标 用 户 同意 后 ,服务 器 更 新 双方 好 友 列 表 并 加 双方 发 送 成 功 信息 和 更 新 后 的 好 友 
列表 。 
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管理 用 户 列 表 功 能 时 序 图 如 图 12-11 所 示 。 


oO 
M 
| 目标 
客户 端 服务 器 数据 库 
| 


| 1. 输入 目标 用 户 名 ， 
单 击 “ 添 加 ”按钮 .| 


2. 提交 好 友 申请 信息 
3. 查询 目标 用 户 、 


4. 返回 查询 结果 


|5. 发 送 好 友 申请 、 


8.2 返回 添加 
9.1 返回 好 友 列 表 — 
10. 显示 黑 新 后 的 列表 | TTT TT 和 
ee mend / 
| | | 


图 12-11 管理 用 户 列表 功能 时 序 图 


12.4.2 网络 通信 模块 


网 络 通信 模块 主要 负责 网 络 通信 及 数据 交互 的 正常 进行 ,是 整个 系统 的 基础 模块 。 
无 论 是 系统 中 请 求 .指令 ,还 是 用 户 发 出 的 通信 和 内容, 都 需要 通过 网 络 通 信和 模块 发 送 至 服 
务 硕 或 其 他 客户 闫 。 网 络 通信 模块 主要 包括 TCP 连接 模块 和 P2P 连接 模块 。 


1. TCP 连接 模块 

TCP 模块 主要 负责 建立 和 维护 客户 端 与 服务 硕 之 间 的 TCP 长 连接 。 客 户 端 与 服务 
器 都 有 TCP 连接 模块 ,系统 中 发 送 的 请 求 、 指 令 , 用 户 发 送 较 短 类 型 的 消息 都 会 通过 
TCP 连接 进行 传递 。 客 户 端 启 动 时 加 服务 器 发 送 建立 TCP 连接 的 申请 ,双方 通过 三 次 
握手 协议 建立 TCP 连接 。 连 接 建 立 后 服务 器 会 保存 客户 端的 网 络 地 址 .连接 状态 等 信 
息 。 由 于 TCP 连接 在 一 段 时 间 内 没有 数据 通信 时 会 被 释放 ,因此 为 了 保持 连接 活跃 , 客 
户 端 在 运行 时 需要 向 服务 器 定时 发 送 心跳 包 ,心跳 包 长 度 很 小 ,并 且 除 了 保持 连接 活跃 ， 
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没有 其 他 作用 。 用 户 退 出 主 界面 ,客户 端 进入 后 台 运 行 时 ,TICP 连接 依旧 保持 活跃 ,客户 
端 可 以 正常 接收 消息 并 显示 在 通知 栏 。 用 户 单 击 “ 退 出 ”按钮 确认 退出 后 ,客户 端 疝 服务 
做 发 送 终止 连接 请 求 , 双方 通过 4 次 挥手 协议 结束 连接 。 


2. P2P 连接 模块 
客户 端 不 仅 有 和 服务 器 通信 的 TCP 模块 ,还 有 与 其 他 客户 端 通信 的 P2P 连接 模块 。 
在 客户 端 需要 进行 长 时 间 、 大 数据 量 的 数据 通信 时 ,需要 在 服务 器 的 协助 下 建立 基于 
UDP 的 P2P 信道 。P2P 信道 的 建立 需要 客户 端的 P2P 通信 模块 和 服务 器 的 P2P 协助 
由 于 通信 双方 的 网 络 环境 不 同 , 客 户 端 可 能 处 于 内 部 网 络 中 ,而 NAT 设备 为 了 防止 
内 部 网 络 的 广播 泛滥 ,会 阻止 许多 外 部 消息 进入 内 部 网 络 ,双方 通信 时 会 受到 NATI 设备 
的 阻碍 ,因此 建立 P2P 连接 首先 需要 穿越 NAT 设备。 客户 端 A 与 客户 端 B 建 立 P2P 连 
接 的 过 程 如 下 。 
。 客户 端 A 首先 通过 与 服务 器 的 TCP ÆR ih] IRS #8 IK P2P 协助 请 求 。 
。 Pig A 通过 P2P 端口 向 服务 万 的 P2P vig O AC TK HE a. LEAR SF REAR A] PP hg 
A 中 了 P2P 端口 映射 至 外 界 的 网 络 地 址 。 
。 服务 器 将 客户 端 A 建立 P2P 连接 的 请 求 和 主机 A 中 P2P 端口 的 对 外 地 址 通过 
TCP 连接 转发 给 客户 端 B。 
。 客户 端 B 收 到 建立 连接 的 请 求 后 ,使 用 P2P 端口 向 服务 器 发 送 接收 连接 的 数据 
包 , 让 服务 器 获得 客户 端 B 中 P2P 端口 的 对 外 网 络 地 址 。 
。 客户 端 B 通 过 P2P 端口 向 客户 端 A 中 P2P 端口 地 址 发 送 数 据 包 ,让 客户 端 B 所 
在 的 NAT 设备 记录 客户 端 A 的 地 址 。 
。 服务 器 将 客户 端 B 中 P2P 端口 的 信息 转发 给 客户 端 A。 
。 客户 端 A 通过 P2P 端口 向 客户 端 B 的 P2P 端口 发 送 数 据 包 ,由 于 客户 端 B 所 在 
的 NAT 设备 已 经 记录 了 客户 端 A 的 P2P 端口 地 址 ,所 以 该 数据 包 能 成 功 穿越 
NAT 设备 ,到 达 客 户 端 B, 同 时 客户 端 A 所 在 的 NAT 设备 也 会 记录 客户 端 B 的 
地 址 信息 。 
。 BP tiie BWC BAP tig A 发送 的 数据 包 后 , 癌 客 户 端 A 发 送 确认 数据 包 。 客 户 端 
A 所 在 的 NAT 设备 已 经 记录 了 客户 端 B 的 地 址 信息 ,因此 该 确认 包 能 正常 到 达 
客户 端 A。 
。 客户 端 A 收 到 确认 包 后 向 客户 端 B 发 送 确 认 包 。 
客户 问 A 能 够 正确 收 到 客户 端 B 发 送 的 确认 包 , 说 明 客户 端 B 到 客户 端 和 A 的 P2P 
信道 成 功 建立 ,客户 端 B 能 够 正确 收 到 客户 问 A 发 送 的 确认 包 , 则 说 明 客 户 端 A 到 客户 
ži BAY P2P 信道 成 功 建立 ,如 图 12-12 所 示 。 
3. 消息 转发 模块 
消息 转发 模块 是 服务 端的 功能 模块 ,负责 将 客户 端 发 送 的 短 消 息 转 发 至 目标 接收 端 。 
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N 
Oa N 
DO / a 
/ \ 
| met | 
NAT 设 备 A NAT 设 备 B| 
| 
\ 
N / 
à a 
= a a / 


cae (7) (9) nen 
客户 端 A ARSS KTB 


图 12-12 P2P 连接 过 程 


服务 器 与 多 个 客户 端 维 持 连 接 , 需 要 维护 一 张 用 户 状 态 表 ,用 于 存储 该 用 户 的 网 络 地 址 、 

服务 句 收 到 一 个 通信 消息 后 ,首先 解析 该 数据 包 ,得 到 通信 目标 用 户 的 ID, 再 使 用 
标 用 户 ID 查询 状态 表 找 出 目标 用 户 的 连接 状态 。 知 服务 器 与 该 用 户 的 连接 存在 , 则 获取 
该 用 户 的 TCP 连接 实例 ,通过 该 连接 实例 将 该 通信 消息 转发 至 目标 客户 端 ,否则 ,服务 器 
就 将 通信 消息 暂 存 至 消息 数据 库 中 ,等 目标 用 户 建 立 连接 后 ,再 从 消息 数据 库 中 读 取 该 消 
BO ,转发 至 客户 端 , 如 图 12-13 所 示 。 


12.4.3 信息 隐藏 模块 


信息 隐藏 模块 是 整个 隐 密 通信 的 核心 模块 ,主要 在 客户 端 执 行 信 息 隐 藏 算法 ,满足 用 
户 的 隐 密 通信 和 功能。 该 模块 分 为 密 信 和 通 人 模块 和 密 信 提取 模块 两 部 分 。 

密 信 购 入 模块 属于 通信 中 发 送 方 的 功能 模块 ,主要 负责 将 秘密 信息 隐 ; 
媒体 载体 中 。 用 户 骨 入 秘密 信息 的 过 程 如 下 。 

CL) 输入 秘密 信息 内 容 。 密 信 可 以 是 文字 、 图 片 文件 等 任意 格式 。 

(2) 输入 密 钥 。 系 统 由 密 钥 生成 密 信 置 乱 参数 和 位 置信 息 置 乱 参 数 ,使 用 密 信和 置 乱 
参数 对 密 信 进 行 置 乱 操作 。 

(3) 系统 对 置 乱 后 的 密 信 进行 编码 ,产生 密 信 的 二 进 制 序列 。 

(4) 用 户 选择 隐藏 载体 ,系统 可 以 使 用 图 像 载体 .音频 载体 和 视频 载体 。 

(5) 对 选 定 载体 进行 内 容 特征 分 析 , 找 出 适合 隐藏 .特征 明显 的 区 域 。 

C6) 将 二 进 制 序列 藤 入 至 特征 明显 的 区 域 ,并 生成 位 置信 息 。 

(7) 使 用 密 信 参数 对 位 置信 息 进 行 置 乱 。 


得 至 选 定 的 多 
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O 
E 消息 目标 
APN 服务 器 数据 库 
| | ) | 
| | , , ’ 
1. 输入 通信 消息 内 容 .| | , | 
| Tt). eR 
a st 3. 查 询 目标 用 户 | 
O O RE | 
Jo 
| ) 4.1 APER. , 
| | i 转发 消息 | 
| | : > 
| | . 
| | 4.2 AR BR 
| | PATHE 
| | 
| | 
| | 
| | 一 一 一 一 一 一 一 一 
| | 
| | |S 返回 存储 结果 | ’ 
| | 
\ | 6. 用 户 上 线 
, | 数据 库 
| | 
| | 
| | 
| | 
| | 
| | 


图 12-13 消息 转发 时 序 图 


完成 密 信 艇 人 过 程 后 ,会 产生 一 个 与 原始 载体 特征 相似 的 携 密 载 体 以 及 一 组 置 乱 后 
的 位 置信 息 ,系统 分 别 将 携 蜜 载体 和 位 置信 息 通过 网 络 通信 模块 发 送 至 接收 端 。 

密 信 提取 模块 属于 隐 密 通信 中 接收 方 的 功能 模块 ,主要 负责 利用 位 置信 息 提 取出 携 
密 载 体 中 的 秘密 信息 ,如 图 12-14 所 示 。 提 取 秘 密 信 息 的 过 程 如 下 。 

(1) 接收 方 收 到 携 密 载体 和 置 乱 后 的 秘密 信息 。 

(2) 输入 密 钥 。 根 据 密 钥 生成 密 信 置 乱 参数 和 位 置信 息 置 乱 参数 。 使 用 位 置信 息 置 
乱 系数 对 置 乱 后 的 位 置信 息 进行 逆 置 乱 操作 ,得 到 原始 位 置信 息 。 

(3) 对 携 密 载体 进行 内 容 特征 分 析 ,结合 位 置信 息 找到 密 信 和 通 人 的 位 置 。 

(4) 从 隐藏 位 置 提取 出 秘密 信息 的 二 进 制 序列 ,并 将 二 进 制 序列 还 原 密 信 。 

(5) 使 用 密 信 置 乱 参数 对 密 信 进行 逆 置 乱 ,得 到 原始 的 秘密 信息 。 
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11. 生成 置 乱 系数 


12. 还 原 位 置信 息 


13. 分 析 载 体 特征 ， 
提取 二 进 制 序列 


图 12-14 信息 隐藏 时 序 图 
125 ”数据 结构 设计 


基于 移动 终端 的 实时 隐秘 系 统 的 业务 中 使 用 了 许多 数据 结构 ,本 节 分 析 和 设计 了 系 
统 中 各 个 功能 模块 中 使 用 的 数据 结构 。 
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1251 有 用户 信息 管理 模块 


1. 注册 功能 
用 户 注册 时 需要 癌 服 务 硕 提交 个 人 喘 份 信息 ,注册 为 系统 的 合法 用 户 。 注 册 功 能 数 
据 结 构 字 段 表 见 表 12-1。 
表 12-1 注册 功能 数据 结构 字段 表 
字段 名 字段 意义 
user_name 用 户 名 ,用 户 登 录 时 需要 使 用 用 户 名 登录 系统 
password 密码 ,用 户 登 录 时 使 用 密码 验证 身份 
phone_number 手机 号 码 , 用 于 发 送 验证 码 信 息 
email address 电子 邮箱 ,用 于 找 回 密码 的 一 种 途径 


注册 功能 使 用 的 数据 结构 为 
typedef struct { 
String user name; // 字 符 串 ,长度 不 超过 64 个 字符 
String password; // 字 符 串 ,密码 为 经 过 MD5 加 密 后 的 密 文 
String phone number; // 字 符 串 ,手机 号 码 为 经 过 正则 表达 式 验 证 后 的 合法 号 码 
String email address; // 字 符 串 ,邮箱 地 址 为 经 过 正则 表达 式 验 证 后 的 合法 地 址 
} REGISTER PACKAGE 


2. 登录 功能 
用 户 登 录 系 统 时 需要 向 系统 提交 自己 的 身份 信息 。 登 录 功 能 数据 结构 字段 表 见 
表 12-2 。 


表 12-2 登录 功能 数据 结构 字段 表 


字段 名 字段 意义 
user_name 用 户 名 ,用 户 在 注册 时 填写 的 身份 名 称 
password 密码 ,用 户 在 注册 时 填写 的 身份 验证 信息 
登录 功能 使 用 的 数据 结构 为 
typedef struct { 
String user_name; // 字 符 串 ,长 度 不 超过 64 个 字符 
String password; // 字 符 串 ,密码 为 经 过 MD5 加 密 后 的 密 文 


} LOGIN PACKAGE 


3. 管理 好 友 列 表 
管理 好 友 列表 功能 包括 添加 好 友和 删除 好 友 ,需要 用 户 向 服务 器 发 出 请 求 ,客户 端 需 
要 向 服务 器 提交 的 数据 字段 见 表 12-3。 
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表 12-3 管理 好 友 功 能 数据 结构 字段 表 
字段 各 字段 意义 
user_name 用 户 名 ,发 出 申请 的 用 户 身份 
target_user_name 目标 用 户 名 ,需要 添加 或 删除 的 目标 用 户 的 身份 
operation 操作 目的 ,说 明 用 户 是 需要 添加 好 友 ,还 是 删除 好 友 
result PRE SAAR » BLAH AR a BAP a Tl AR 


管理 好 友 列 表 使 用 的 数据 结构 为 
typedef struct { 
String user name; // 字 符 串 ,长度 不 超过 64 个 字符 
String target user name; LFE, BAA MD5 加 密 后 的 密 文 
byte operation; L/F EA, 表示 添加 好 友 ,1 表示 删除 好 友 
boolean result; // 布 尔 型 ,true 表示 操作 成 功 ,false 表示 操作 失败 
} FRIDMANAGE PACKAGE 


12.5.2 网络 通信 模块 
网 络 通信 模块 使 用 的 数据 结构 主要 是 通信 消息 。 通 信 消 息 数 据 结构 字段 表 
表 12-4, 
表 12-4 通信 消息 数据 结构 字段 表 
字段 名 字段 意义 
source user name 发 送 方 用 户 名 ,消息 发 送 方 的 用 户 身 份 
target_user_name 接收 方 用 户 名 ,消息 接收 方 的 用 户 身 份 


send time 消息 发 送 时 间 ,记录 消息 发 送 的 时 间 
message_type 消息 类 型 ,描述 消息 的 类 型 (如 文字 图片. 语音、 视频 等 ) 


message_extension 消息 内 容 扩 展 名 ,描述 非 文字 消息 的 内 容 格 式 
message content 消息 内 容 , 通 信 消 息 的 具体 内 容 


通信 消息 使 用 数据 结构 为 


typedef struct { 
string source user name; // 字 符 串 ,长 度 不 超过 64 个 字符 
String target user name; // 字 符 串 ,长度 不 超过 64 个 字符 


Date send time; /7/ 日 期 类 型 ,表示 消息 发 送 的 日 期 和 时 间 
byte message type; // 布 尔 型 ,true 表示 操作 成 功 ,false 表示 操作 失败 


String message extension; // 字 符 串 ,表示 非 文字 类 型 消息 的 内 容 格 式 
bytel | message content; // 字 节 数 组 ,存放 具体 的 消息 内 容 


} MESSAGE PACKAGE 


见 
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12.5.3 信息 隐藏 模块 


1. 秘密 信 息 
秘密 信息 使 用 的 数据 结构 主要 是 对 待 艇 人 的 密 信 进行 存储 。 密 信和 数据 结构 字段 表 见 
表 12-5 。 
表 12-5 ” 密 信 数据 结构 字段 表 


字段 各 字段 意义 
message_type 密 信 类 型 ,描述 密 信 的 消息 类 型 (如 文字 图像 .文件 等 ) 
o, 密 信 扩展 名 ,对 于 非 文 字 消 息 ,需要 指定 密 信 的 格式 ,接收 端 根 据 格 式 还 原 密 
message extension l 
J fi gi: 
message_length 密 信 长 度 , 描 述 秘密 信息 的 长 度 
message_content 密 信 内 容 , 秘 密 信 息 的 实际 内 容 


秘密 信息 使 用 的 数据 结构 为 


typedef struct { 


byte message type; // 字 节 型 ,0 表示 文字 消息 ,1 表示 文件 消息 
String message extension; // 字 符 串 ,表示 非 文字 类 型 消息 的 内 容 格式 
long message length; // 长 整数 型 ,表示 密 信 内 容 所 占 的 字 节 数 


bytel] message content; // 字 节 数 组 ,存放 具体 的 密 信和 内容 
} MSG PACKAGE 
2. 隐藏 载体 
隐藏 载体 所 使 用 数据 结构 主要 描述 原始 载体 或 携 密 载体 的 信息 ,应 包含 的 数据 字段 
风 表 12-6, 


R 12-6 载体 数据 结构 字段 表 


字段 名 字段 意义 
covert_type 载体 类 型 ,描述 载体 的 类 型 (如 图 像 . 音 频 、 视 频 等 ) 
covert_extension 载体 扩展 名 ,用 于 描述 多 媒体 载体 的 格式 信息 
covert length RAKE, FAVE Se EA AR RY HK EE 
covert_content 载体 内 容 , 多 媒体 载体 的 实际 内 容 
隐藏 载体 使 用 的 数据 结构 为 
typedef struct { 
byte covert_type; // 字 节 型 ,0 为 图 像 载 体 ,1 音频 载体 ,2 为 视频 载体 
String covert extension; // 字 符 串 ,表示 多 媒体 载体 的 内 容 格 式 
long covert length; // 长 整数 型 ,表示 载体 内 容 所 占 的 字 节 数 
bytel | covert content; // 字 节 数 组 ,存放 具体 载体 的 内 容 数 据 
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} COVERT PACKAGE 


12.5.4 ”数据 库 设计 


本 系统 中 的 数据 库 主要 分 为 两 部 分 : 客户 端 数据 库 和 服务 器 数据 库 。 
客户 端 数据 库 通 过 Android 系统 提供 的 SQLite 数据 库 实 现 。SQLite 是 一 种 可 靠 的 
轻 量 级 关系 型 数据 库 。 客 户 端 中 数据 库 主 要 存储 的 是 与 其 他 用 户 的 消息 记录 ,可 以 让 用 
户 查询 以 前 通信 的 消息 内 容 。 客 户 端 数据 库 只 需要 存储 通信 记录 ,只 有 一 张 通 信 记 录 表 ， 
记录 表 中 的 各 个 字段 见 表 12-7, 
表 12-7 客户 端 通信 消息 表 


字段 名 字段 意义 
ID 整数 型 ,该 数据 表 的 主键 
SEND USER 字符 串 ,消息 的 发 送 者 
RECEIVE_USER 字符 串 ,消息 的 接收 者 
RECEIVE _ DATE 日 期 类 型 ,消息 发 送 的 时 间 
MESSAGE_TYPE 整数 型 Ze AN We BIA LS AY 2S 
MESSAGE FILE PATH i i: a a. rong 则 该 字段 为 空 , 反 之 该 字段 表示 消息 文 
MESSAGE CONTENT — 息 , 则 该 字段 保存 文字 消息 的 内 容 , 反 之 该 
IS_MESSAGE_READ 布尔 类 型 ,表示 该 消息 是 否 被 阅读 


服务 器 数据 库 主 要 分 为 两 部 分 : 用 户 信息 数 据 库 和 消息 数据 库 。 用 户 信 息 数 据 库 主 
要 存储 用 户 的 个 人 资料 、 号 份 信息 、 每 个 用 户 的 好 友 列 表 等 信息 ,分 为 用 户 信息 表 、 状 态 信 
用 户 信 息 表 存储 用 户 的 个 人 资料 和 号 份 信息 , 见 表 12-8, 
表 12-8 用 户 信 息 表 


字段 名 字段 意义 
ID 整数 型 ,该 数据 表 的 主键 
USER_NAME 字符 串 ,表示 用 户 的 用 户 名 
USER_PWD 字符 串 ,表示 用 户 的 密码 


USER PHONE NUMBER 字符 串 ,表示 用 户 的 电话 号 码 
USER EMAIL ADDRESS 字符 串 ,表示 用 户 的 邮箱 地 址 


状态 信息 表 存 储 用 户 的 状态 信息 , 见 表 12-9。 
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表 12-9 状态 信息 表 


字段 名 字段 意义 
ID 整数 型 ,外 键 , 是 用 户 信息 表 的 主键 
USER STATE 布尔 型 ,表示 用 户 和 服务 器 的 连接 状态 
USER_ADDRESS 字符 串 AR TR FAP Be ed a SR MAFRA 
HAS_MESSAGE 布尔 型 ,表示 用 户 是 否 存在 离线 消息 


好 友 关 系 表 表示 当前 用 户 有 哪些 好 友 , 用 户 量 增多 时 关系 表 的 记录 数 会 大 量 增加 , 因 
此 系统 对 每 个 用 户 都 需要 创建 一 个 好 友 关 系 , 见 表 12-10。 
表 12-10 ”好友 关系 表 


字段 名 字段 意义 
ID 整数 型 ,当前 数据 表 的 主键 
USER_ID 整数 型 ,外 键 ,表示 当前 用 户 的 好 友 ID 
USER_STATE 布尔 型 ,表示 当前 好 友 的 连接 状态 


消息 数据 库 主要 存储 用 户 发 送 的 消息 , 当 用 户 通 信 消 息 的 目标 用 户 不 在 线 时 ,服务 兹 
就 将 该 消息 存 进 服务 器 。 消 息 数 据 表 见 表 12-11. 
表 12-11 消息 数据 表 


字段 名 字段 意义 
ID 整数 型 ,当前 数据 表 的 主键 
MESSAGE SEND USER 整数 型 ,外 键 ,表示 当前 用 户 的 好 友 ID 


MESSAGE RECEIVE USER | 布尔 型 ,表示 当前 好 友 的 连接 状态 


MESSAGE RECEIVE DATE | 日 期 类 型 ,消息 的 发 送 日 期 


MESSAGE TYPE 整数 型 ,表示 当前 消息 的 类 型 

四 字符 串 , 知 消 息 是 文字 消息 , 则 该 字段 为 空 , 反 之 该 字段 表示 消息 文 
a 件 在 文件 系统 中 的 绝对 路 径 
MESSAGE CONTENT aoe 息 为 文字 消息 , 则 该 字段 保存 文字 消息 的 内 容 , 反 之 该 
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